【お知らせ】プログラミング記事の投稿はQiitaに移行しました。

Wiktionaryにページを初投稿しました

Novial のスワデシュ・リストのページを作成しました。

目次

概要

作成したページです。

スワデシュ・リストと Novial について Wikipedia から引用します。

スワデシュ・リスト (英語:Swadesh list)とは、「基礎語彙」を集めた様々なリストのうちの一種であり、モリス・スワデシュが1940年代から1950年代にかけて発展させたものである。語彙統計学(言語間の近縁度の量的な見積もり)や、言語年代学(言語の分岐年代の決定)に用いられる。

ノヴィアル(Novial)は、いかなる母語も侵されない国際交流を促進する目的で開発された国際補助語である。それまでイド語の運動に参加し、後にインターリングアの開発に携わることになるデンマーク言語学者イェスペルセンが開発した。

経緯

Novial は有名な言語学者が作成した人工言語で、かなりのポテンシャルを秘めている気がします。他の人工言語とざっくりと比較するためスワデシュ・リストを探しました。

Wiktionary には見当たりませんでしたが、以下に不完全なリストがありました。(後半に抜けが多いです)

この Auxlang Wiki をあちこち眺めていると、同じようなページがもう1つありました。

ロシア語版 Wiktionary が出典だと記載されています。

12個の人工言語を並べてスワデシュ・リストを比較しています。言語の選択がマニアックで、最近知った SambahsaPandunia の他にも初めて聞く言語がいくつかあります。

辞書

いずれにせよ Novial のリストは不完全なので、調べて埋める必要があります。

Novial の辞書を探すと、ダウンロードできる形で提供されているのを見付けました。

しかしこの辞書にはいくつか問題があり、以下で校訂した辞書が公開されています。

これを1行1単語のテキスト形式に変換して、コマンドラインから利用できるようにしました。

※ 当初は校訂版に気付かずに古い方を使っていました。校訂版との差分を取ったところ、ミスタイプの修正などが丁寧にされていることに気付き感激しました。

Glosbe

辞書が使えるようになったので、念のためすべての単語を調べてリストを埋め始めました。

いくつか見当たらない単語がありましたが、Glosbe で調べると出てきました。

情報には提供元が書いてあります。Novial の場合、訳語は WiktionaryOmegaWiki、例文は Tatoeba の情報を使っています。Novial のように資料が少ない言語だと、出典の異なる情報をまとめてくれるだけでもかなり有効だと感じました。

OmegaWiki

Wiktionary と Tatoeba はお馴染みですが、OmegaWiki は初めて知りました。

調べてみると、Wiktionaryとは別の方向性を狙ったプロジェクトだと知りました。

似たような単語でも言語ごとにカバーする語義が違ったりしますが、その問題に正面から向き合おうとしているようです。

データを CC0 で提供しているのも素晴らしいです。

Basically, we are of the opinion that all our data should be in the public domain. However, this is not possible (in many countries, you cannot abandon your copyright).

So, we had to choose a license, and we selected the most free that we found, which is CC0.

完成

このように必要な情報が割とスムーズに揃ったため、あまり苦労せずにスワデシュ・リストは完成しました。他の人工言語と比較して Novial のポテンシャルを探ってみたいです。