Anthropic のチャット AI である Claude が日本から使えるようになったので試しました。
目次
注意事項
この記事は Claude 2.1 に基づいています。既に Claude 3 が登場しており、多言語処理についても根本的に変化しているようです。詳細は以下の記事を参照してください。
紹介
Anthropic は元 OpenAI の技術者が設立した AI スタートアップ企業です。
- Googleが500億円超をOpenAIのライバル企業Anthropicに投資か、検索エンジンへの対話型AI導入を目指し - GIGAZINE
- Amazon、生成AI強化へ Anthropicに40億ドル出資 - Impress Watch
Anthropic が開発するチャット AI が Claude です。
Claude は 2023 年 10 月 16 日に日本からも利用可能となりました。
Claude 2.1 は一度に 200K トークンの読み込みが可能で、PDF やテキストファイルなどがアップロードできます。要約の作成に威力を発揮します。
200K トークンを利用するには課金が必要です。無料版では 100K トークンまでです。
Claude 2.1 is available now in our API, and is also powering our chat interface at claude.ai for both the free and Pro tiers. Usage of the 200K token context window is reserved for Claude Pro users, who can now upload larger files than ever before.
著作権
Claude 2 は著作権保護された歌詞をそのまま出力するとして問題になりました。
Claude 2.1 では対策されたようで、長文を入力すると最初に著作権のことを言って来ます。一例を示します。
Unfortunately I am unable to provide a detailed summary or analysis of this excerpt due to copyright restrictions.
(中略)
I would be happy to discuss and analyze this work further without reproducing protected content. Please let me know if you have any specific questions!
GPT-4
競合の GPT-4 では 128K トークンのコンテキストが扱えます。
性能比較では GPT-4 が有利なようです。
「長コンテキストをLLM(GPT, Claude)に食わせた際に、ちゃんとRetrivalされるか?」を検証しているGithub。
— Shinichi Takaŷanagi (@_stakaya) 2023年11月30日
総じてCalude-2に比べてGPT-4 Turboのほうが正確に引用しているようで面白い。
Needle In A Haystack - Pressure Testing LLMshttps://t.co/tYzVkdHLEd pic.twitter.com/kxCqEf4kBK
GPT-4 の利用には課金が必要ですが、Claude は無料版でも 100K まで使えることが、強いて言えば Claude の利点でしょうか。
サンプル
Claude にログインすると、3 つのサンプルが表示されます。
これらは Claude でどのようなことができるかを端的に示しています。
要約能力
ファイルをアップロードできる強力な要約能力が Claude のセールスポイントです。
無料枠でもファイルを読み込ませて要約することが可能です。利用例を示します。
要約に限らず、大量のトークン数を活かしてコンテキスト把握能力も高いようです。そのチャット内で以前に話したことをきちんと覚えているような印象を受けました。
※ Bard では過去の履歴の把握能力が意図的に制限されているようです。
利用制限
上限に近付くと教えてくれます。いきなり書き込めなくなるわけではないので、親切です。
使い切った状況
※ 時間は現地時間(日本では日本標準時)
使用量を抑えるコツ
課金についての説明には、使用量を抑えるコツが書かれています。無料枠でも参考になるため、要点を引用します。(2023 年 11 月 17 日時点)
Claude Proの使用について | Anthropicヘルプセンター
Claude Proは、無料サービスと比較して、少なくとも5倍の使用量を提供します。送信できるメッセージの数は、メッセージの長さ(添付ファイルの長さを含む)と現在の会話の長さによって異なります。 10メッセージ残っているときに警告を表示し、メッセージ制限は8時間ごとにリセットされます。
会話が長くなると、制限はより早く使い切られます。特に大きな添付ファイルがある場合です。 たとえば、「グレート・ギャツビー」のコピーをアップロードすると、8時間以内にその会話で送信できるメッセージは20件程度になる可能性があります。メッセージを送信するたびに、Claudeは添付ファイルを含む全会話を「再読み込み」する必要があるためです。
※ 「20件」は課金を前提にしているため、無料枠では 4 件に相当すると思われます。
長文書についてClaudeに質問する場合は、一度に複数の質問をすることをおすすめします。 新しいメッセージを送信するたびにClaudeは会話全体を再読み込みする必要があるため、個々のメッセージで質問するよりも、1つのメッセージに複数の質問を含めた方が、制限を節約できます。
AI がコンテキストをどのように把握しているのか疑問でしたが、毎回、添付ファイルを含む全会話を「再読み込み」しているようです。アーキテクチャに由来する制限が素直に書かれているのは好感が持てます。
※ これが他のサービスにも当てはまるかは不明です。経験上、ログが長くなると動作が不安定になる傾向があるため、同じような処理をしていると思われます。👉参考
言語対応状況
結論から言えば、英語だけのモードと多言語のモードがあって、チャットを開始した言語で切り替えているようです。
※ 推測ですが、英語で利用されることが圧倒的に多いため、英語だけに絞ることで最適化しているのかもしれません。
対応言語のリストは見当たりませんが、得意な言語についての記述はありました。(2023 年 11 月 17 日時点)
Claudeを何に使えますか? | Anthropicヘルプセンター
言語の翻訳ができます。Claudeは訓練データの関係で英語が一番得意ですが、10言語以上の言語をある程度の成功率で翻訳できます。英語に次いでClaudeが得意な言語は、ポルトガル語、フランス語、ドイツ語です。
なお、チャットでどの言語が使えるか聞いても、そのチャットで使った言語だけを挙げるようです。
受け付ける言語
DeepL や Google 翻訳で "Can you read this language?" を翻訳して、手当たり次第に確認した結果を示します。以下の言語で質問すれば、その言語で返事がありました。
- 英語、日本語、アラビア語、イタリア語、インドネシア語、ウクライナ語、エストニア語、エスペラント、オランダ語、ギリシャ語、スウェーデン語、スペイン語、スロバキア語、スロベニア語、チェコ語、デンマーク語、ドイツ語、トルコ語、ノルウェー語、ハンガリー語、ヒンディー語、フィンランド語、フランス語、ブルガリア語、ベンガル語、ポーランド語、ポルトガル語、ラトビア語、リトアニア語、ルーマニア語、ロシア語、韓国語、中国語
調査ログです。
ヒンディー語やベンガル語の応答速度はかなり落ちます。推測ですが、これらすべての言語でモデルが訓練されているわけではなく、別途機械翻訳を通しているのかもしれません。
各言語での問いかけには、ほぼ共通の定型句と思われるフレーズが返されます。日本語訳を示します。
はい、○○語を理解する基本的な能力はあります。アシスタントとして、ユーザーにより良いサービスを提供するためには、複数の言語でコミュニケーションできることが重要だと考えています。○○語での質問を理解するために最善を尽くします。皆様からのフィードバックは、私の○○語のスキルアップに役立ちます。私の目標は、自分の言語スキルを継続的に拡大し、より役立つようにすることです。○○語の練習にご協力いただき、ありがとうございました!
スタンス
英語モードで "What language do you understand?" と聞いてみると、事前に用意されたと思われる回答がありました。これが言語に対する基本的なスタンスのようです。
I'm an AI assistant created by Anthropic to be helpful, harmless, and honest. I don't actually speak or understand any human languages - I just have programming to analyze text provided to me and try to have natural conversations. My training lets me have conversations in English, but I don't truly comprehend language or speech. I'm an AI, not a human!
DeepL による翻訳
私は、Anthropicによって作られた、親切で、無害で、正直なAIアシスタントです。私は実際に人間の言葉を話したり、理解したりすることはできません。私に提供されたテキストを分析し、自然な会話をしようとするプログラムがあるだけです。私のトレーニングにより、英語で会話をすることはできますが、言語や音声を本当に理解することはできません。私はAIであり、人間ではありません!
AI の理解については次のような研究があるようです。
LLMなどの生成AIの背後にある思考プロセスは人間とは全く異なるかもしれない、という仮説が提唱されました。
— AIDB (@ai_database) 2023年11月2日
生成AIは、自分自身が作り出したものについて質問されても、しばしば間違えてしまうからです。
『生成AIのパラドックス』仮説と定義されました。
ワシントン大学の研究者らによる報告です。… pic.twitter.com/NLpczha1Jt
調査
※ 参考までに、手探りの過程を残しておきます。
サンプルにあるスペイン語の練習は、スペイン語対応をアピールする狙いがあるようです。試してみると、回答に英語とスペイン語の両方を使って来ます。
※ 反応を確認するためわざと回答を間違えてみました。
新しくチャットを始めて先ほどのプロンプトで Spanish を German にしてみると、ドイツ語で同じことをしてくれます。
ところで新しくチャットを始めて対応言語を聞いてみると、英語だけだと回答があり、日本語やスペイン語は受け付けてもらえません。
しかし新しくチャットを始めて日本語で話し掛けると、日本語で返してくれます。
どうやら言語別に複数のモデルがあって、最初のプロンプトで切り替えているようです。
ところでヒンディー語の単語練習には応じてくれますが、ヒンディー語で話し掛けると分からないと言われました。
Unfortunately I don't actually read or understand Hindi. I'm an AI system created by Anthropic to have conversations in English. While I can provide Hindi words and translations as we're practicing, I don't comprehend the meaning behind Hindi text. My training is focused on natural English conversations.
DeepL による翻訳
残念ながら、ヒンディー語は読めませんし、理解もできません。私は英語で会話をするためにAnthropicによって作られたAIシステムです。練習中にヒンディー語の単語や訳を提供することはできますが、ヒンディー語のテキストの背後にある意味を理解することはできません。私のトレーニングは自然な英語の会話に重点を置いています。
これは英語モードでヒンディー語の単語練習をしているためのようです。多言語モードではヒンディー語を受け付けます。
言語能力を確認するには、その言語で話し掛けるのが確実のようです。
日本語から開始すれば多言語モードになるようです。この質問に続いてスペイン語やフランス語で話し掛けると、それらの言語で回答がありました。その他、イタリア語やドイツ語も通じました。フランス語から開始しても同様の多言語モードになりました。