Watch

ニューラルネットワーク:ChatGPT演算子、Claude Citations、DeepSeek R1c

ニューラルネットワーク:ChatGPT演算子、Claude Citations、DeepSeek R1c

Neuralへようこそ。AIは急速に進化しています。私たちは、その進化に追いつくお手伝いをします。初回では、OpenAIの新たなフロンティアの始まり、よくあるAI批判に対するAnthropicの思慮深い解決策、そして大統領のAIに関する大統領令の駆け引きについて探ります。さあ、最新のAIニュースを理解していきましょう。

ChatGPTがOperatorと連携

OpenAIは最近、ChatGPTの18金ゴールドApple Watchエディションをリリースしました。ChatGPT Proは月額200ドルのサブスクリプションで、ティム・クック氏もAppleが顧客1人あたりでこれほどの継続収益を上げていればと願うほどです。

本日より、ChatGPT Pro は AI 愛好家に、より高いリクエスト制限を超えてサブスクライブする大きな新たな理由を提供します。

Operator をご紹介します。OpenAI はこれを「独自のブラウザを使ってユーザーに代わってタスクを実行できるエージェントの研究プレビュー」と呼んでいます。ミームの作成から食料品の注文、フォームへの入力まで、OpenAI は Operator を、ユーザーが指示したタスクを実行する最初のエージェントの一つと呼んでいます。

本日、Webにアクセスしてタスクを実行できるエージェント「Operator」をリリースします。Operatorは独自のブラウザを使用してWebページを閲覧し、入力、クリック、スクロールなどの操作が可能です。現在はリサーチプレビュー段階であるため、機能に制限があり、ユーザーからのフィードバックに基づいて進化していきます。

Operatorは、月額200ドルの有料プランではなくなります。OpenAIは将来的に、このAIツールをPlus、Team、Enterpriseの有料プランのユーザーにも開放する予定です。現在、Operatorは米国のChatGPT Proユーザー全員がoperator.chatgpt.comでご利用いただけます。

OpenAI によれば、Operator は同社の新しい Computer-Using Agent (CUA) テクノロジーを搭載しているという。

Powering Operatorは、GPT-4oの視覚機能と強化学習による高度な推論機能を組み合わせたモデルであるコンピュータ利用エージェント(CUA)です。CUAは、人間と同じように、画面に表示されるボタン、メニュー、テキストフィールドなどのグラフィカルユーザーインターフェース(GUI)を操作するように訓練されています。これにより、OSやWeb固有のAPIを使用せずにデジタルタスクを柔軟に実行できます。[…]

CUAはまだ初期段階にあり、限界はあるものの、OSWorldでフルコンピュータ使用タスクにおいて38.1%、WebベースのタスクにおいてWebArenaで58.1%、WebVoyagerで87%という、最先端のベンチマーク結果を達成しました。これらの結果は、CUAが単一の汎用アクションスペースを用いて多様な環境をナビゲートし、操作する能力を浮き彫りにしています。

家族と過ごす時間を増やすために、Neuralを辞めることを発表するには、ちょうど良いタイミングだと思います。

今後のNeuralはすべてOperatorがお届けします。コンピューターを使うエージェントが、人類のためにAIニュースを翻訳してくれると確信しています。

いや、ちょっと早口だった。どうやらChatGPT Proのサブスクリプションに問題があるみたいだ。復帰したぞ!

しかし、真面目な話、Operatorは明らかに大きな存在です。2025年1月はAIの進歩におけるマイルストーンとして振り返ることになるでしょう。コンピュータ・ユーザー・エージェント技術は、ChatGPT-5の登場はいつになるのかと問い続けるAI懐疑論者を納得させるかもしれません。

今週のOpenAIのもう一つの大きなニュースは?それはStargateだ。サム・アルトマンがXで言ったように、「大きくて美しい建物」だ。

スターゲイトとは何でしょうか?基本的にはテキサス州にある巨大なコンピューター脳です。OpenAIは今週、この取り組みについて詳細を報告しました。

スターゲイト・プロジェクトは、今後4年間で5,000億ドルを投資し、米国におけるOpenAIのための新たなAIインフラの構築を目指す新興企業です。1,000億ドルの投資を直ちに開始します。このインフラは、AI分野におけるアメリカのリーダーシップを確固たるものにし、数十万人の雇用を創出し、世界全体に莫大な経済効果をもたらすでしょう。このプロジェクトは、米国の再工業化を支援するだけでなく、米国とその同盟国の国家安全保障を守るための戦略的能力も提供します。

Stargateの初期出資者は、ソフトバンク、OpenAI、オラクル、MGXです。ソフトバンクとOpenAIはStargateのリードパートナーであり、ソフトバンクが財務責任を、OpenAIが運営責任を負います。会長には孫正義氏が就任します。

Arm、Microsoft、NVIDIA、Oracle、OpenAIが主要な初期技術パートナーです。現在、テキサス州を皮切りに構築が進められており、最終合意に向けて、全米各地で新たなキャンパスの候補地を検討しています。

Stargate の一環として、Oracle、NVIDIA、OpenAI が緊密に協力してこのコンピューティング システムの構築と運用に取り組みます。

もちろん、野心的な AI 企業の背後には野心的な億万長者がおり、その億万長者たちはスターゲイトの資金をめぐって X で争っている。

スターゲイトには一切関与していないxAI社のイーロン・マスク氏は、Xの発表に対し「実際には資金を持っていない」と反論した。マスク氏はさらに、ソフトバンクが「100億ドルをはるかに下回る」資金を確保していると確かな情報筋から聞いていると付け加えた。

一方、アルトマン氏は関係者らが資金を確保していると確信している。

一方、OpenAIの責任者は、トランプ氏に関してはプレイできないキャラクターの罠に陥ったと述べている(トランプ氏はスターゲイトについて言及し、現在では自身のキャラクターをプレイ可能にしている)。

率直に言って、私は億万長者の人間関係の複雑さよりも、ChatGPT Operator の将来性にはるかに楽観的です。

クロードは引用文とともに領収書を持ってくる

一方、AIの安全性に対して常に慎重なアプローチをとってきたAnthropicは、Claudeチャットボット向けにCitationsと呼ばれる有望な新ツールをリリースしている。

本日、Claude が回答をソース文書に基づいて作成できる新しい API 機能「Citations」をリリースします。Claude は、回答を生成するために使用した正確な文や文章への詳細な参照を提供できるようになり、より検証可能で信頼性の高い出力を実現します。[…]

これまで、開発者はClaudeにソース情報を含めるよう指示する複雑なプロンプトに依存していましたが、その結果、パフォーマンスが不安定になり、プロンプトのエンジニアリングとテストに多大な時間を費やすことがよくありました。Citations機能により、ユーザーはコンテキストウィンドウにソース文書を追加できるようになりました。モデルにクエリを実行すると、Claudeはそれらのソースから推論された主張を出力に自動的に引用します。

弊社の内部評価では、Claude に組み込まれた引用機能はほとんどのカスタム実装よりも優れており、リコール精度が最大 15% 向上することが示されています。

Anthropic は、顧客サポートのクエリ担当者やドキュメント要約タスクなどの関連するユースケースを指摘しています。

ベストな見解は?Kyle B. RusselによるXに関するコメント(引用は不要)

Claude 3.5 Sonnet と Claude 3.5 Haiku は、本日より Citations に対応しており、Anthropic では探索用にドキュメントも用意しています。

新しいAI大統領令が前回のAI大統領令を上回る

大統領選挙からの短い休憩の後、AIに関するアメリカの政策に戻りましょう。

トランプ大統領は木曜日、大統領令への署名競争を継続し、バイデン政権のAI政策に関する大統領令をトランプ政権のAI政策に関する大統領令で撤回した。

お忘れかもしれませんが、バイデン大統領のAIに関する大統領令は、人工知能の安全性、インフラ基準、雇用の混乱緩和、そして透明性確保のためのAIコンテンツへの透かし入れに重点を置いていました。要約すると、バイデン大統領の大統領令は以下のとおりです。

  • 人工知能(AI)の安全、安心、信頼できる開発を強調しました。
  • 重要なインフラストラクチャ、サイバーセキュリティの強化、連邦政府資金によるプロジェクトの監視に関する義務付けられた標準。
  • 雇用の混乱の緩和、公平性の推進、公民権の保護など、社会的課題に取り組みました。
  • AI 生成コンテンツには透明性を確保し、人間が作成したコンテンツと区別するために透かしを含めることが義務付けられました。

AP通信の報道によると、トランプ大統領のAIに関する大統領令は、「アメリカのAIイノベーションの障壁となっている」過去の政府政策を撤回し、アメリカは「イデオロギー的偏見や仕組まれた社会的な意図のないAIシステムを開発しなければならない」と付け加えている。

AP通信によると、トランプ大統領のAI大統領令は、広範な政策指令とは別に、「180日以内にAI行動計画を策定する」ことを承認しており、この計画はトランプ大統領によって任命された元PayPal幹部のデビッド・サックスAI・暗号通貨担当特別顧問が率いることになる。

今後、テクノロジー企業は、一定のパワー閾値を超える AI モデルの開発について政府に開示する必要がなくなります。

DeepSeek R1との激しい競争

一方、AI競争はアメリカ企業間だけにとどまりません。今週、中国のAI企業DeepSeekがR1モデルファミリーをリリースしました。

R1のユニークな点は、モデルがローカルで実行可能で、OpenAIのChatGPT 4oモデルに匹敵するパフォーマンスを実現していることです。ローカルモデルは、マシン外で動作するモデルよりも性能が劣る傾向があるため、この開発中のモデルとDeepSeekは注目に値します。

問題は?R1は、1989年の天安門事件や台湾独立といったテーマに関しては、当然ながら国家承認の世界史観を持っているということだ。AIレースの勝敗がまだ明らかでなかったとしても、念のため言っておくと、そういうことだ。


AI 開発の最新情報については、 Neuralの次号でさらに詳しくお伝えします— 9to5Mac 限定!

人気のiPhoneアクセサリー

  • Anker 621 マグネット式ポータブル充電器
  • Ailun iPhone 16 スクリーンプロテクター
  • Beats Solo Buds
  • Apple MagSafe充電器(1m)
  • Anker USB-A/USB-C 充電器

printmazings.com を Google ニュース フィードに追加します。 

FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。

Printmazings
Printmazings is a contributing author, focusing on sharing the latest news and deep content.