言语とフラクタル 使用の集积の中にある偶然と必然
自然言语には、Zipf則として知られる大域的な---マクロな---性質が複数あり、それらは押し並べて冪乗則の形態をとる。自然言语のマクロな性質は、複雑系科学の系譜において主に論じられてきた。従来、言语は言语学で科学的に捉えられる以外に、自然言语処理分野で工学的に研究されている。このマクロな性質は、このいずれでもあまり取り上げられることのない言语の根源的性質の一つである。主として物理学誌において散発的に論じられてきていることから、研究フロンティアが見えにくかった。本書はこのフロンティアを複数の背景の観点からまとめるものである。
本书は、以下の4つを论じている。
1. 言语のマクロな性質としてどのようなものがあるのか。(第2, 3部)
2. マクロな性質とミクロな性質 (単語や文法など) はどのように関係するのか。(第4部)
3. その工学的意義は何か。(第5部)
4. 言语に関する思想とどのように関わり得るのか。(第6部)
1については、Zipf則の派生則としてHeaps則などが従来知られ、本書ではこれらの関係を整理している。その上で、Zipf則は極限定理として成り立つ、つまり、避け得ない統計的必然の上に言语が成立している、という立場を本書はとっている。さらに、Zipf則は、単語の分布についてのものであるが、マクロな性質には、もう一種類、系列に関する性質もあり、著者は自らフロンティアにおいて研究を進めてきた。そこからは文脈のゆらぎに見られる統計的自己相似性が浮かび上がる。
このようなマクロな性質は、ミクロな言语の性質に影響を与える。言语のミクロ的性質としては、単語や慣用句などの言语の要素の成り立ち、文法構造、また意味構造などを挙げることができる。これらが、マクロ的性質との関連でどのように説明され得るかを上の2では論じている。
続く上の3においては、言语に対するマクロな視点が、今日の言语工学を支える一つの科学の可能性でもあることを論じている。現在、自然言语の文書は、深層学習を利用し、系列から系列へと包括処理される。包括処理の一つの基礎は言语モデルとなるが、歴代の言语モデルは、本書で論じている冪乗則により、その特質を検証することができる。深層学習によるAIの飛躍が言われるが、その一端は、自然言语のマクロな性質を、深層学習に基づく言语モデルが満たし始めたこととして解釈される、と本書では論じている。
最后の4において、本书は、着者の前着『记号と再帰』の続编でもあることが説明される。『记号と再帰』では、记号が本来的に再帰的であることが论じられた。すると、记号の连関から成る系全体も、再帰的な态様を持つはずである。记号の系が有する全体论的な性质を构造主义では『构造』と言い表してきたが、その『构造』とは具体的に何を表すのか、ということについてはアナロジーによる説明に留められてきた。本书で论じるマクロ的法则は、幂乗则の形态をとる以上、それは统计的自己相似性を表すのであるが、それこそは、『构造』の一つの説明の形态である可能性を示唆する。
(紹介文執筆者: 先端科学技术研究センター 教授 田中 久美子 / 2022)
本の目次
第1章 はじめに
第2章 普遍
第3章 複雑系としての言语
第II部 要素の分布の特性: 開放性?稀少性
第4章 顺位频度分布
第5章 Zipf 則の普遍性
第6章 派生的な幂乗则
第III部 系列の特性: 塊現象?長期記憶
第7章 単语の出现间隔分布
第8章 长相関
第9章 ゆらぎ
第10章 复雑さ
第IV部 統計的言语普遍から言语の部分構造へ
第11章 言语要素の分節
第12章 単语の意味?価値
第13章 要素の大きさと频度
第14章 长期记忆と文法构造
第V部 統計的言语普遍と言语の数理モデル
第15章 窜颈辫蹿则に関する理论的考察
第16章 数学的生成モデル
第17章 言语モデル
第痴滨部 思索的考察
第18章 再帰性?自己相似性と记号
第19章 言语ゲームと稀少性
第20章 統計的言语普遍と「構造」
结语
第21章 结语
付记
1 用语と记法
2 数学的补足
3 データ
関连情报
第75回毎日出版文化賞(自然科学部門)『言语とフラクタル』 (毎日新聞社 2021年11月)
第75回毎日出版文化赏选评 (毎日新闻朝刊18面 2021年11月3日)
着者インタビュー:
毎日出版文化賞の人々 /上 文学?芸术部門 河尻亨一さん/人文?社会部門 益田肇さん/自然科学部門 田中久美子さん (毎日新聞夕刊4面 2021年11月10日)
书籍绍介:
じんぶん堂: ビッグデータ時代における「情報」の知と人文知 紀伊國屋書店員さんおすすめの本 (好書好日 2022年1月31日)
【編集部による新刊紹介】田中久美子 著 『言语とフラクタル』 (东京大学出版会 | note 2021年6月10日)
英语版:
Statistical Universals of Language - Mathematical Chance vs. Human Choice (Springer刊 2021年)