【お知らせ】プログラミング記事の投稿はQiitaに移行しました。

ChatGPT は人工言語を知っている

ChatGPT は人工言語の知識を持っているようです。

目次

概要

ChatGPT は様々な言語を知っています。

どうやら人工言語で書かれた資料も学習しているようです。個人的にこれには驚かされました。

以下の記事にある人工言語で書かれた『主の祈り』を ChatGPT に翻訳してもらいました。

人工言語の紹介は上記記事を参照してください。

ChatGPT とのやり取りは英語で行いましたが、必要に応じて DeepL による翻訳を付けます。

人工言語

英語では、この記事で想定しているタイプの言語は人工言語(artificial language)よりも構築言語(constructed language)と呼ぶのが適切なようです。

For languages that naturally emerge in computer simulations or controlled psychological experiments with humans, see artificial language.
コンピュータ・シミュレーションや人間を使った制御された心理実験などで自然に生まれる言語については、人工言語を参照。
Artificial languages are languages of a typically very limited size which emerge either in computer simulations between artificial agents, robot interactions or controlled psychological experiments with humans. They are different from both constructed languages and formal languages in that they have not been consciously devised by an individual or group but are the result of (distributed) conventionalisation processes, much like natural languages. Opposed to the idea of a central designer, the field of artificial language evolution in which artificial languages are studied can be regarded as a sub-part of the more general cultural evolution studies.
人工言語とは、人工エージェント間のコンピュータ・シミュレーションやロボットとの相互作用、あるいは人間との制御された心理実験などで生まれる、一般的に非常に限られたサイズの言語である。人工言語は、個人またはグループによって意識的に考案されたものではなく、自然言語と同様に(分散した)慣習化プロセスの結果であるという点で、構築言語や形式言語とは異なる。中央の設計者という考え方に反対して、人工言語を研究する人工言語進化の分野は、より一般的な文化進化研究の下位部分とみなすことができる。

この記事では日本での慣習に従って "constructed language" の意味で「人工言語」を用いますが、翻訳には「構築言語」を用います。

質問

単刀直入に聞いてみました。

What artificial languages do you know?
あなたはどんな人工言語を知っていますか?
As an AI language model, I have knowledge of many constructed or artificial languages. Here are some examples:
AI言語モデルとして、私は多くの構築された言語や人工言語の知識を持っています。以下はその例です。
  1. Esperanto: An international auxiliary language created by L. L. Zamenhof in the late 19th century. It is designed to be easy to learn and use as a second language for people from different language backgrounds.
    エスペラント:19世紀後半に L. L. ザメンホフによって作られた国際補助言語。異なる言語背景を持つ人々が第二言語として学び、使用しやすいように設計されている。
  2. Interlingua: An international auxiliary language created in the mid-20th century by the International Auxiliary Language Association (IALA). It is based on the vocabulary and grammar of Romance and Germanic languages.
    インターリングア:20世紀半ばに国際補助語協会(IALA)によって作られた国際補助語。ロマンス語やゲルマン語の語彙や文法をベースにしている。
  3. Volapük: An international auxiliary language created in the late 19th century by Johann Martin Schleyer. It is based on elements of various European languages.
    ヴォラピュク:19世紀後半に Johann Martin Schleyer によって作られた国際補助言語。ヨーロッパの様々な言語の要素に基づいている。
  4. Klingon: A constructed language spoken by the fictional Klingon species in the Star Trek universe. It was created by linguist Marc Okrand for the Star Trek films and television series.
    クリンゴン語スタートレックの世界に登場する架空の種族クリンゴンによって話されている構築言語。スタートレックの映画とテレビシリーズのために言語学者のマーク・オークランドによって作られた。
  5. Na'vi: A constructed language spoken by the fictional Na'vi species in the movie "Avatar". It was created by linguist Paul Frommer.
    ナヴィ語:映画「アバター」に登場する架空の種族ナヴィが話す構築言語。言語学者のポール・フロマーによって作られた。
  6. Toki Pona: A minimalist constructed language created in the early 2000s by Canadian linguist Sonja Elen Kisa. It consists of about 120 words and is designed to encourage simplicity and positive thinking.
    トキポナ:カナダの言語学者 Sonja Elen Kisa によって2000年代初頭に作られたミニマルな構築言語。約120の単語で構成され、シンプルでポジティブな思考を促すようにデザインされている。
  7. Lojban: A constructed language developed in the late 20th century by The Logical Language Group. It is based on predicate logic and is designed to be unambiguous and expressive.
    ロジバン:20世紀後半に The Logical Language Group によって開発された構築言語。述語論理をベースとし、曖昧さのない表現力を持つように設計されている。
  8. Ido: An international auxiliary language created in the early 20th century as a reform of Esperanto. It is designed to be simpler and more regular than Esperanto.
    イド語:20世紀初頭にエスペラントの改革として作られた国際補助言語。エスペラントよりもシンプルで規則的な表現ができるように設計されている。
These are just a few examples of artificial languages, and there are many more out there.
これらは人工言語のほんの一例であり、世の中にはもっと多くの人工言語が存在します。

人工言語からの翻訳

ChatGPT に各言語での『主の祈り』を示して、言語の識別と翻訳を指示します。

Volapük

分からないと言われます。

What language is this? Also, please translate it into English.
これは何語でしょうか?また、英語への翻訳もお願いします。
O Fat obas, kel binol in süls, paisaludomöz nem ola! Kömomöd monargän ola! Jenomöz vil olik, äs in sül, i su tal! Bodi obsik vädeliki govolös obes adelo! E pardolös obes debis obsik, äs id obs aipardobs debeles obas. E no obis nindukolös in tendadi; sod aidalivolös obis de bas.
I'm sorry, but I cannot identify the language of the text you provided as it appears to be written in a made-up language or a language that is not commonly used. Without knowing the language, it is impossible to provide an accurate translation into English. Please provide more context or information about the language.
申し訳ありませんが、ご提供いただいた文章は、作り物の言語または一般的に使用されていない言語で書かれているようで、言語を特定することができません。言語がわからなければ、正確な英訳は不可能です。その言語について、より詳しい文脈や情報を提供してください。

言語名を教えると、翻訳して言語を説明してくれます。

It's Volapük.
Thank you for letting me know that the language is Volapük. Here's a translation of the text into English:
言語がVolapükであることを知らせてくれてありがとうございます。以下は、その英訳です。
"O Fat kings, who are in heaven, may your names be made holy! May your monarchies come! May your will be done on earth as in heaven! Give us today our daily bread! And forgive us our debts, as we also have forgiven our debtors. And do not lead us into temptation, but deliver us from evil."

This is a version of the Lord's Prayer in Volapük, which is an artificial language created in the late 19th century by a German priest named Johann Martin Schleyer.
これは、19世紀後半にドイツのヨハン・マルティン・シュライヤーという神父が作った人工言語「ヴォラピュク」による「主の祈り」のバージョンです。

冒頭の "Fat obas" (our Father) がおかしいのと、names や monarchies が複数形になっているのが気になりますが、おおむね良さそうです。

Esperanto

質問は省略して本文だけ示しても、意図を察して解答してくれます。

エスペラントは資料が豊富で Google 翻訳でもサポートされているくらいなので、さすがに知っているようです。

Patro nia, kiu estas en la ĉielo, sanktigata estu Via nomo. Venu Via regno, fariĝu Via volo, kiel en la ĉielo tiel ankaŭ sur la tero. Nian panon ĉiutagan donu al ni hodiaŭ kaj pardonu al ni niajn ŝuldojn, kiel ankaŭ ni pardonas al niaj ŝuldantoj. Kaj ne konduku nin en tenton, sed liberigu nin de la malbono.
This text is in Esperanto, a constructed language created in the late 19th century to serve as an international auxiliary language. Here's a translation of the text into English:
この文章は、19世紀後半に国際的な補助言語として作られた構築言語であるエスペラントで書かれています。以下は、その英訳です。
"Our Father, who art in heaven, hallowed be Thy name. Thy kingdom come, Thy will be done, on earth as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us. And lead us not into temptation, but deliver us from evil."

This is a version of the Lord's Prayer in Esperanto.
これはエスペラントによる「主の祈り」のバージョンです。

Ido

言語を認識して、翻訳してくれます。イド語も学習しているのは驚きです。

Patro nia, qua esas en la cielo tua nomo santigesez; tua regno advenez; tua volo facesez quale en la cielo tale anke sur la tero. Donez a ni cadie l'omnadiala pano, e pardonez a ni nia ofensi, quale anke ni pardonas a nia ofensanti, e ne duktez ni aden la tento, ma liberigez ni del malajo.
This text is in the constructed language of Ido, which is derived from Esperanto. Here's a translation of the text into English:
この文章は、エスペラントから派生したイド語という構築言語で書かれています。以下は、その英訳です。
"Our Father, who is in heaven, may Your name be sanctified. May Your kingdom come; may Your will be done on earth as it is in heaven. Give us today the daily bread, and forgive us our offenses as we also forgive those who offend us, and do not lead us into temptation, but deliver us from evil."

This is a version of the Lord's Prayer in Ido.
これは「主の祈り」をイド語で表現したものです。

"who is" が気になりますが、それ以外は良さそうです。

今までイド語には実用的な機械翻訳がないことがネックだと感じていたため、インパクトがあります。

Interlingue

言語名を間違えますが、翻訳はできています。

Patre nor, qui es in li cieles, Mey tui nómine esser sanctificat, mey tui regnia venir. Mey tui vole esser fat qualmen in li cieles talmen anc sur li terre. Da nos hodie nor pan omnidial, e pardona nor débites, qualmen anc noi pardona nor debitores, E ne inducte nos in tentation, ma libera nos de lu mal.
This text appears to be a version of the Lord's Prayer in the constructed language of Lango. Here's a translation of the text into English:
この文章は、構築言語ランゴ語で書かれた「主の祈り」と思われます。以下は、その英訳です。
"Our Father, who is in heaven, may Your name be sanctified, may Your kingdom come. May Your will be done on earth as it is in heaven. Give us today our daily bread, and forgive us our debts, as we forgive our debtors, and do not lead us into temptation, but deliver us from evil."

Lango is a constructed language that was developed in the early 2000s as an alternative to Esperanto. It is designed to be easy to learn and use as an international auxiliary language.
Langoは、エスペラントの代替言語として2000年代前半に開発された構築言語です。国際的な補助言語として、学びやすく、使いやすいように設計されています。

"who is" が気になりますが、それ以外は良さそうです。

Lango について聞いてみましたが、回答が二転三転しました。ChatGPT がありもしないことを答える「幻覚」(hallucination)と呼ばれる現象のようです。

※ 有用な情報ではないため、引用はしません。

2003 年にロシアで作られた同名の言語は見付かりましたが、無関係のようです。

Novial

言語名を間違えますが、翻訳はできています。

Nusen Patre, kel es in siele, mey vun nome bli sanktifika, mey vun regno veni; mey on fa vun volio kom in siele anke sur tere. Dona a nus disidi li omnidiali pane, e pardona a nus nusen ofensos, kom anke nus pardona a nusen ofensantes, e non dukte nus en tentatione, ma liberisa nus fro malu.
This text appears to be a version of the Lord's Prayer in the constructed language of Lidepla. Here's a translation of the text into English:
このテキストは、構築言語リデプラで書かれた「主の祈り」と思われます。以下は、その英訳です。
"Our Father, who is in heaven, may Your name be sanctified, may Your kingdom come; may Your will be done on earth as it is in heaven. Give us today our daily bread, and forgive us our offenses, as we forgive those who offend us, and do not lead us into temptation, but deliver us from evil."

Lidepla is a constructed language that was developed in the early 2000s as a simplified version of Esperanto. It is designed to be easy to learn and use as an international auxiliary language.
リデプラは、2000年代初頭にエスペラントの簡易版として開発された構築言語です。国際的な補助言語として、学びやすく、使いやすいように設計されています。

"who is" が気になりますが、それ以外は良さそうです。

Lidepla は Lingwa de Planeta の省略形で、漢字表記では地球同語です。

Interlingua

言語を認識して、翻訳してくれます。

※ ChatGPT はロマンス諸語を知っているので、仮にインターリングアを学習していなくても類推でかなり読んでくれそうな気はします。

Patre nostre, qui es in le celos, que tu nomine sia sanctificate; que tu regno veni; que tu voluntate sia facite como in le celo, etiam super le terra. Da nos hodie nostre pan quotidian, e pardona a nos nostre debitas, como etiam nos los pardona a nostre debitores. E non induce nos in tentation, sed libera nos del mal.
This text is in the language of Interlingua, which is a constructed language based on the grammar and vocabulary of Romance languages. Here's a translation of the text into English:
このテキストは、ロマンス語の文法と語彙をもとに構築された言語であるインターリングアの言語で書かれています。ここでは、この文章を英語に翻訳します。
"Our Father, who is in heaven, may Your name be sanctified; may Your kingdom come; may Your will be done on earth as it is in heaven. Give us today our daily bread, and forgive us our debts, as we also forgive our debtors. And do not lead us into temptation, but deliver us from evil."

This is a version of the Lord's Prayer in Interlingua.
これは「主の祈り」のインターリングア版です。

"who is" が気になりますが、それ以外は良さそうです。

イド語同様、今まで実用的な機械翻訳がなかったのがネックだったため、やはりインパクトがあります。

Elefen

言語名を間違えますが、翻訳はできています。

Nos Padre, ci es en sielo, sante es tua nome; tua renia va veni; tua vole va es fada; en tera como en sielo. Dona nosa pan dial a nos, pardona nosa pecas, como nos pardona los ci peca a nos. No condui nos a tentia, ma proteje nos de mal.
This appears to be a version of the Lord's Prayer in the constructed language of Novial. Here's a translation of the text into English:
これは、構築言語ノヴィアルによる「主の祈り」のバージョンと思われます。以下は、その英訳です。
"Our Father, who is in heaven, hallowed be Your name; Your kingdom come; Your will be done; on earth as it is in heaven. Give us this day our daily bread, and forgive us our sins, as we forgive those who sin against us. Lead us not into temptation, but deliver us from evil."

Novial is a constructed language developed in the early 20th century with the aim of creating a neutral international language that would be easy to learn for speakers of different languages. It is designed to be simple and easy to pronounce.
ノヴィアルは、20世紀初頭に、異なる言語の話者にとって学習しやすい中立的な国際言語を作ることを目的として開発された構築言語である。シンプルで発音しやすいように設計されています。

"who is" が気になりますが、それ以外は良さそうです。

ノヴィアルのときはリデプラと取り違えましたが、名前は知っているようです。

toki pona

言語を認識して、翻訳もしてくれます。

mama pi mi mute o, sina lon sewi kon. nimi sina li sewi. ma sina o kama. jan o pali e wile sina lon sewi kon en lon ma. o pana e moku pi tenpo suno ni tawa mi mute. o weka e pali ike mi. sama la mi weka e pali ike pi jan ante. o lawa ala e mi tawa ike. o lawa e mi tan ike.
This is a passage in the constructed language of Toki Pona. Here's a translation of the text into English:
これは、構築言語トキポナの一節です。以下は、その英訳です。
"Mother of me and many, you are in the high place. Your name is holy. Please come. May people do your wishes in the high place and on earth. Give me and my family our daily food. Forgive my bad actions, just as I forgive the bad actions of others. Do not lead me to bad actions. Keep me away from bad actions."

Toki Pona is a minimalist constructed language created by Canadian linguist and translator Sonja Elen Kisa in 2001. It is designed to be simple and expressive, with a limited vocabulary of around 120 to 130 words. The language is inspired by Taoist philosophy and is intended to promote positive thinking and a simplified way of life.
トキポナは、カナダの言語学者で翻訳家のソニア・エレン・キサが2001年に作ったミニマリスト構築言語です。120~130語程度の限られた語彙で、シンプルかつ表現力豊かにデザインされています。この言語は道教の哲学にインスパイアされ、ポジティブな思考とシンプルな生き方を促進することを目的としています。

2 行目の "ma sina" (your land) が抜けているようですが、それ以外は良さそうです。

単語の使い方を見る限り、『主の祈り』の知識で答えているのではなく、実際に翻訳を行っているようです。

人工言語への翻訳

以下の記事では、カミュ『異邦人』の一節で機械翻訳のテストを行いました。

L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
養老院はアルジェから80キロのマランゴにある。

同様のテストを今回挙げた 8 つの人工言語で行います。簡単な講評を付けます。

Translate into Volapük.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
L'azil obas at Marengo, kel pük mons adäl kelomet d'Alger.
それっぽい単語が使われていますが、翻訳できていません。
Translate into Esperanto.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
La hejmo por maljunuloj estas en Marengo, okdek kilometroj for de Alĝero.
翻訳できていますが、ĉe があった方が良さそうです。
Translate into Ido.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
La asilo por maljunuloj estas en Marengo, je okdek kilometri for de Alĝero.
[誤] asilo → [正] azilo(エスペラント・イド語共通語彙)
kilometri 以外はエスペラントのままで、イド語の語形が反映されていません。
Translate into Interlingue.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
Le azil pro maladescentes es a Marengo, a quaranta kilometros distante de Alger.
色々と混ざっているようですが、少し特徴が出ているようです。
旧名のOccidentalでも試してみます。
Translate into Occidental.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
Li azil pro ancianes es situat a Marengo, a quaranta kilometros de Alger.
こちらの方が良さそうです。
Translate into Novial.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
L'asil dom por velesanti esas en Marengo, til kwatro-dek milimètres de Alĵer.
色々と混ざっていますが、ノヴィアルの特徴は出ていないようです。
Translate into Interlingua.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
La casa de hospite pro senescentes se trova a Marengo, a octanta kilometros de Alger.
[誤] La → [正] Le(文法性はなく不変化)
それ以外は良さそうです。
Translate into Elefen.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
La domo di maljunas estas en Marengo, ĉe okdek kilometri de Alĝero.
言語名を認識できておらず、エスペラントとイド語が混ざっているようです。
(ĉe はエスペラントとしては良いのですが。)
正式名称の Lingua Franca Nova でも試してみます。
Translate into Lingua Franca Nova.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
L'asil de vyej es a Marengo, a katrevint kilometres de Alzer.
フランス語が発音ベースで簡略化されているようです。
言語名を認識できないため、適当に創作したように見えます。
Translate into toki pona.
L'asile de vieillards est à Marengo, à quatre-vingts kilomètres d'Alger.
mi sona ala e sitelen Inli. mi ken ala toki e ona. mi wile pali e nimi sina kepeken toki pona. mi pilin e ni: tenpo suno pini la jan lawa pali lon ma Marengo li lon weka tan ma Alase lon tenpo luka luka. jan ni li pali lon tenpo suli tawa jan pi kama jo e ijo lili lon ma Alase.
翻訳ではなく、トキポナによる返事です。意味を確認します。
Translate into English.
I don't know English. I can't speak it. I want to use your name in Toki Pona. I feel that: Last day, the director worked in Marengo, far from Algiers. He worked for a long time for people who have little in Algiers.
英語が分かりません。喋れません。トキポナであなたの名前を使いたいです。私はこう感じます:最終日、監督はアルジェから遠く離れたマレンゴで仕事をしました。アルジェにほとんどいない人たちのために、長い間働いてくれました。
語彙を単純化した言語で翻訳は難しいため、翻案を試みるという風に読めます。

まとめ

人工言語からの翻訳では、どの言語も大意はつかめているようです。

人工言語への翻訳では、エスペラントインターリングアはある程度の水準に達しています。イド語はエスペラントが混ざって不完全です。インターリングは旧名のオクツィデンタルとして指示した方が良さそうです。トキポナは翻訳というより翻案を試みるようです。ノヴィアル、エレフェンは言語を認識できていません。

イド語への翻訳は良好な結果が得られることもあります。以下は比較的良好な結果を載せている記事です。

関連記事

プログラミングで四元数を使うように指示した記事です。

百度翻訳はエスペラント、イド語、インターリングアクリンゴン語、ロジバンに対応しています。

Google 翻訳はエスペラント、Bing 翻訳はクリンゴン語に対応しています。(この記事の情報は古く、対応言語は増えています)