スポンサーサイト

--.--.-- *--
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

JavaCCでunicode

2009.10.06 *Tue
萌え木を定義する論理型言語(萌え木以外にも使えることを意図)を作ろうと思ってJavaCCを使っている。flex/bisonを使わなかったのはunicodeを使うのが大変そうだったから。論理型言語というのは時代に逆行していて個人的にはイケていると思っている。

JavaCCにはUNICODE_INPUTというオプションがあって、これをtrueにするだけでunicodeが使える。ちょっと失敗があったのでメモ :

トークンを多バイト文字にすることはできるが、エスケープしないで文字を直に書く場合、ソースファイル(.jjファイル)のエンコードはunicodeではなくsjisでないといけない(Windowsだけ?)。

恐らくこれは基本的にはJavaCCではなくJavaの問題だと思われる。JavaのいうUnicodeってutf16なんですね。

ちなみにJavaCCはLL文法しか扱えないらしい。yacc/bisonなどのLALR文法より扱えるクラスは小さいが、うまく変換すればほとんどのプログラミング言語はLLで表現できるとのこと。なんか、ANTLR使った方がよかった気がしてきた。もう面倒なのでJavaCCでとりあえずやってみるつもりだが。

構文解析って学生時代に勉強した記憶があるけど、今アルゴリズムを見ても全然思い出せない。今思えばあの頃やった事って結構大事な事が多かった。でも当時は必要性が理解できなかったのでまじめに勉強しなかったのがちょっと後悔。それ以外にもグラフ理論も今になってすごく大事な気がしているし(しかも良書があまりない!昔の教科書をとっといてよかった...)。

極めつけは型推論だ。あれは本当にキツかった。落第寸前だったが先生に懇願して許してもらったんだった。あれは今だにあまり有用性がわからなかったりする。MLのよさを理解するには必要?
で、ML関係でぐぐると、学生時代のクラスメートがガンガンに活躍しているのがわかったりしてちょっと嬉しいw
スポンサーサイト
COMMENT : 0
TRACKBACK : 0
CATEGRY : 実装

COMMENT

Comment Form


秘密にする
 

TRACKBACK

TrackBack List

プロフィール

大和田 茂

Author:大和田 茂


元IT系の研究家。現在はゲーム/玩具作家をめざしている。


Stud Hungering for Intense Gratification and Erotic, Rapturous Undulation


Get Your Sexy Name





Twitter Updates



    follow me on Twitter




    最近の記事



    最近のコメント



    最近のトラックバック



    月別アーカイブ



    カテゴリー



    ブロとも申請フォーム

    この人とブロともになる



    ブログ内検索



    RSSフィード



    リンク

    このブログをリンクに追加する



    Copyright © 大和田茂ブログ All Rights Reserved.
    Images from ふるるか Designed by サリイ
    上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。