
今週初め、Appleをはじめとするテクノロジー大手企業がYouTubeの字幕をAIモデルの学習に使用していたことが調査で明らかになりました。これには、MKBHDやMr. Beastなど、17万本以上の動画が含まれていました。Appleはこのデータセットを、4月にリリースされたオープンソースのOpenELMモデルの学習に使用しました。
しかし、 Apple は9to5Macに対して、OpenELM は Apple Intelligence を含む AI や機械学習機能のいずれにも利用されていないことを確認しました。
Apple、YouTubeのAIトレーニング論争に反応
Appleは、研究コミュニティへの貢献とオープンソースの大規模言語モデル開発の推進を目的としてOpenELMモデルを開発したと述べています。Appleの研究者はこれまで、OpenELMを「最先端のオープン言語モデル」と表現してきました。
Appleによると、OpenELMは研究目的のみに開発され、Apple Intelligence機能の基盤として使用される予定はないとのことです。このモデルはオープンソースとして公開されており、Appleの機械学習研究ウェブサイトなど、広く利用可能です。
OpenELMはApple Intelligenceの一部として使用されていないため、「YouTube字幕」データセットはApple Intelligenceの基盤として利用されていません。Appleは以前、Apple Intelligenceのモデルは「特定の機能を強化するために選択されたデータや、当社のウェブクローラーによって収集された公開データを含む、ライセンスされたデータ」に基づいて学習されていると述べています。
最後に、Apple は OpenELM モデルの新しいバージョンを構築する予定はないとも述べています。
Wiredが今週初めに報じたように、Apple、Anthropic、NVIDIAといった企業が、この「YouTube字幕」データセットをAIモデルの学習に使用しました。このデータセットは、非営利団体EleutherAIが運営する「The Pile」と呼ばれる大規模なデータセットの一部です。
printmazings.com を Google ニュース フィードに追加します。
FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。