私はコンパイルと解釈を理解しようと、段階的に全体像を把握しようとしています。だから、この記事を読んでいる間に質問に思いついた。http://www.cs.man.ac.uk/~pjj/farrell/comp3.htmlこの記事
それは言います:
コンパイラの次の段階は、パーサーと呼ばれます。コンパイラのこの部分は、言語の文法を理解しています。構文エラーを特定し、エラーのないプログラムを別の言語で解釈または書き出すことができる内部データ構造に変換する責任があります。
しかし、トークナイザーが構文エラーのある特定のストリームを適切にトークン化する方法を理解できませんでした。
そこにとどまるか、パーサーに間違った情報を提供する必要があります。トークン化は一種の翻訳者でもないのですか?
したがって、トークン化中にコードの字句破損行をどのように単に克服するか。
トークナイザーの見出しの上のリンク内にトークンの例があります。
私が理解しているように、トークンの形式は次のように思えます。コードに何か問題があると、トークンも破損します。
私の誤解を明確にしていただけますか?