AI第2次ブームを支えたエキスパートシステムと知識表現について。
目次
全体像
- 人工無能
- 知識ベース構築、エキスパートシステム
- エキスパートシステムの限界(知識獲得のボトルネック)
- 意味ネットワーク
- オントロジー
- 概念感の関係(is-a、part-of)
- オントロジーの構築
- ワトソン、東ロボくん
オントロジー
Cycプロジェクト
すべての一般常識をコンピュータに取り込もうというプロジェクト。
オントロジー
- 知識の記述や共有が難しい→「知識を体系化する方法論」の研究へと進展していく
- オントロジー=もともと”存在論”という意味
- 定義:「概念化の明示的な仕様」
- 目的:「知識の共有と活用」
- 特定の領域の言葉の定義やその関連性を形式化→それにより新たな知識の創出・共有の様々な局面に役立てようという試み
- 「言葉(語彙)」「その意味」「それらの関係性」→他人と共有できるように明確な約束事(仕様)として定義
- 概念の記述を一定のルールに基づいて行うことで、知識をつなげていくことが可能になる
- ある単語を検索する際、似た意味の言葉を一緒に検索することが可能になる
概念感の関係(is-a、part-of)
is-a
- 上位概念と下位概念の関係→「推移律」
- AとBに関係があり、BとCに関係がある→AとCにも自動的に関係がある
part-of
- 「全体と部分の関係」
- 色々な種類の関係があり、最低5種類の関係がある
オントロジーの構築
ヘビーウェイトオントロジー(重量オントロジー)
- 知識をどのように記述すべきかを哲学的にしっかり考えて行う
- 時間とコストがかかる
- Cycプロジェクト(一般常識の手動取込み)はいまだに続いている
ライトウェイトオントロジー(軽量オントロジー)
- 効率重視で、とにかくコンピュータにデータを読み込ませて、できる限り自動的に行う
- 使えるものであればいい
- 分類関係の正当性は深く問わない
- ウェブマイニング:Webデータを解析し知識を取り出す
- データマイニング:ビッグデータを解析して有用な知識を取り出す
- セマンティックWeb(Webサイトが保つ意味をコンピュータを理解させてコンピュータ同士で処理を行わせる)
- LOD(コンピュータ処理に適したデータを公開・共有するための技術)
ワトソン、東ロボくん
ワトソン
- Question=Ansewering(質問応答)
- ライトウェイトオントロジーを生成し、回答に用いている
- 質問に含まれるキーワードと関連しそうな答えを高速に検索する
東ロボくん
- 質問の意味を理解していない=読解力に問題あり
- 基本、東大合格は不可能と考えられ、2016年に開発凍結