• 講義要項やWebシラバスの記載内容は、登録された受講生の人数や理解度に応じて、授業開始後に変更となる可能性があります。

main start


開講年度 2016年度 開講箇所 大学院情報生産システム研究科

担当教員 ルパージュ イヴ
学期曜日時限 春学期  火1時限
科目区分 情報アーキテクチャ分野 配当年次 1年以上 単位数 2
使用教室 講義室1 キャンパス 北九州
科目キー 440111250A 科目クラスコード 01
授業で使用する言語 英語
  コース・コード INFI611L
大分野名称 情報学
中分野名称 知的システム
小分野名称 一般
レベル 修士レベル 授業形態 講義


最終更新日時:2016/05/10 17:52:08


コミュニケーションを取るために人間は言葉を使います。テキストは文字に保存された言葉です。ウェブ上での膨大なテキストを処理すれば、知識を生産できます。このコースでは、自然言語の主な2つの動向を紹介する。知識に基づく動向では、言語学の結果を形式化して適応する。 算数に基づく動向では統計やベクトル手法を使用する。このコースでは、その2つの動向の基本手法とその有用性を紹介する。

Language is the means by which human beings communicate. The web contains an enormous amount of texts, that is language in written form, that waits for processing, so as to produce new knowledge. This course will present a survey of natural language (text) processing in its two major trends. The first trend is knowledge-based and relies on the formalization of results in linguistics. The second trend is numerical and is based on statistical or vectorial techniques. The course will present a series of techniques and their usefulness.

授業の到達目標 語彙・統合・意味の基本概念の理解の上、主なデータ構造とアルゴリズムを理解する。また、webサイトの重要なツールを知ること。

To know some basic notions about vocabulary, syntax and meaning. To know some basic data structures and algorithms. To know major off-the-shelf tools and their sites.
事前・事後学習の内容 予習としてCourse N@viに掲載するスライド事前読了を求めます。また、小テストのため直前週のスライドの再勉強が必要です。小テスト後Course N@viに掲載する解答の勉強も求めます。予習には90分~120分かかると想定されます。

Reading the slides uploaded to Course N@vi before the lecture is mandatory. Also, revision of the slides of the previous week is required for the short test. Studying the he answers of the short test uploaded to Course N@vi is also necessary. 90 to 120 minutes is the estimated time of individual or group preparation.
授業計画 [1] 自然言語企業の一覧 / Overview of applications of NLP, the NLP industry
[2] 言語・文字・コード・国際規格 / Languages, writing systems, encoding, ISO standards

知識に基づく手法入門 / Introduction to symbolic/knowledge-based techniques

[3] 語彙(1) / Lexicon (1): words, dictionaries, terminologies, flexional/derivational morphology
[4] 語彙(2) / Lexicon (2): lexical units and lexical functions in the Meaning-Text Theory (MTT)
[5] 文法(1) / Syntax (1): constituency representations and dependency representations
[6] 文法(2) / Syntax (2): grammars, parsing, the CYK algorithm
[7] 文法(3) / Syntax (3): attribute-value matrices, unification, unification grammars
[8] 意味論(1) / Semantics (1): classification of words and relations between words (WordNet, MindNet, etc.)
[9] 意味論(2) / Semantics (2): formal concept analysis

算数に基づく手法 / Introduction to numerical approaches

[10] 用語(1) / Vocabulary (1): term occurrences, inverse index, document retrieval
[11] 用語(2) / Vocabulary (2): Zipf's laws, meaningful words
[12] 文法(1) / Syntax (1): n-gram language models
[13] 文法(2) / Syntax (2): smoothing, quality measures (perplexity, Kullback-Leibler)
[14] 意味論(1) / Semantics (1): co-occurrence measures for monolingual collocations
[15] 意味論(2) / Semantics (2): multilingual alignment, construction of bilingual dictionaries
教科書 授業直後にCourse N@viで授業の内容のスライドを公開します。
Slides will be made available after lectures.
参考文献 参考文献や関係サイトのURLをスライドに載せます。
References to papers or books will be given during the lectures and are given in the slides, usually with direct URL when possible.
割合 評価基準
試験: 50% 最終試験を実施します。授業の内容全般についての理解度を評価します。
A final test is organized. It will assess the general understanding of the course.
平常点評価: 50% 10回ほど、授業において、前回授業の復習テストを実施します。
About 10 times, a short test is done before the lecture.
備考・関連URL Course N@viでスライドを公開します。
また、毎回復習テストの答えもCourse N@viで公開します。
Slides we be made available through Course N@vi.
The results of the short tests will be made available through Course N@vi.


Copyright © Media Network Center,Waseda University 2006-2019.All rights reserved.