FrontPage

未知語の定義

 “未知語”は機械による処理の場合と人間における処理の場合とでその定義は異なる。  なお、ここで言う ”機械” とは、人工知能搭載の実機ロボット、人工知能2D/3キャラクタ型知的エージェント、あるいは、機械翻訳システム等を指すものとする。 [#z6b3d299]

  1. 機械処理における未知語:システムの単語辞書において、明示的に登録されていない単語のこと。
  2. 人間における未知語:初見の語。人間の心的辞書(mental lexicon)に登録されていない語を想定しているが、心的辞書に登録(銘記)されていても、想起できないために見かけ上初見の語となることもあり得るため、初見であるか否かは客観的に判定できない。

解説

概要

人間は、言語を媒体として相互の意思疎通を行う場合、状況や背景的知識等を 適宜利用して、見かけ上同一の表現であっても多様な意味を表現・伝達することが できるとともに、さらには必要に応じて新たな単語や表現を創造する。これに対して、 その受信者は、多くの場合何の支障もなく、それらの単語や表現に担われた発話者の 意図する意味を円滑に推察し理解することができる。人間がこのようなことをなし 得るのは、人間が多義的な表現に対して発信者の意図した意味を推察することが できるとともに、新たに創造された初見の表現に対しても、ほとんどの場合その 意味を推察することのできる能力を持っているからである。つまり初見(未知)の 単語であっても、文字・形態素・造語法・統語情報・談話情報等の言語的知識や、 文脈・背景的知識等の言語外知識を用いて、初見であることすら気付くことなく 迅速かつ適切にその意味を理解することができる。人間はこのような優れた能力を 持ち合わせているために、“人間にとっての未知語”という概念は、必ずしも 明確には定義することはできない。

一方、現在の機械は、上述したような高度な処理能力を持っておらず、一般的には、 単語辞書と、単語の配列を規定する文法規則(統語規則)とを主たる知識として 言語処理を行っているため、多義的な表現や新しい創造的な表現は、十分に 処理することができない。特に、システムの単語辞書に予め載っていない単語は、 システムにとっては未知となる。本稿ではこのような観点から、「機械にとっての 未知語」とは未登録単語のことであるとし、以下の議論ではこの定義によるものと する。

未知語の分類

  1. 第1種の未知語(異表記同義語の未知語)
  2. 第2種の未知語(未知複合語)
  3. 第3種の未知語(真性の未知語)

第1種の未知語(異表記同義語の未知語)

  • コンピュータ <-> コンピュータ
  • ディジタル <-> デジタル
  • ギリシア <-> ギリシャ, イタリア <-> イタリヤ
  • ゲーテ,ギョーテ,ギョヲーテ など

第2種の未知語(未知複合語)

  • 失恋旅行,積み立て旅行 など

第3種の未知語(真性の未知語)

  • スマートバリュー
  • KMD48

(以下、編集中)

  • アクセス数=3027 since 2010.10.21

トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2017-01-15 (日) 16:10:39 (333d)