AWSre:Invent2025:20年積み上げてきたAWSのビルディングブロックはAI時代も通用するのか?
AWSre:Invent2025で、AWSUtilityComputingSVPのピーター・デサントス氏が基調講演に登壇。AI時代におけるAWSの強みと、推論ワークロードへの最適化について語り尽くしました。20年以上にわたって培ってきたAWSの「ビルディングブロック」は、進化し続けるAIの世界でも引き続き重要な役割を果たすとしています。
AI時代に求められる5つの要件
デサントス氏は、AI時代においても変わらない重要な要素として、セキュリティ、可用性、弾力性、コスト、そして俊敏性の5つを挙げました。これらの要素は、AWSがクラウドサービスを構築する上での基本的な考え方であり、すべてのサービスやAPIの技術的な判断の基準となっているとのことです。
教科書にも載るAWSの技術基盤
AWSは、初期のAmazonEC2で顕在化したジッタ(遅延)の問題を解決するために、仮想化処理をハードウェアでオフロード化するAWSNitroSystemを開発しました。このNitroSystemは、パフォーマンスとセキュリティを大幅に向上させ、コンピューターアーキテクチャの教科書にも掲載されるほど革新的な技術として評価されています。
自社開発チップ「Graviton」の進化
AWSは、さらにパフォーマンス向上を目指し、自社開発のARMプロセッサーGravitonを開発。4世代にわたる進化を遂げ、コスト性能比を高めています。最新のGraviton5は、前世代モデルと比較して25%の性能向上を実現し、AirBnBやAtlassianなどの企業で既に効果を発揮しています。冷却技術にもこだわり、電力消費を3割削減することにも成功しています。
サーバーレスの進化:AWSLambdaManagedInstances
2013年に登場したサーバーレスサービスAWSLambdaは、開発者がコードを実行するだけでアプリケーションを構築できる画期的なサービスです。AWSは、EC2インスタンスとサーバーレスのチームを統合し、サーバーレスのシンプルさとインフラコントロールを両立するAWSLambdaManagedInstancesを発表。EC2インスタンス上でLambdaを実行できるようになり、開発者はインフラの管理から解放され、コードに集中できます。
推論ワークロードへの最適化
AIの普及に伴い、推論ワークロードの重要性が増しています。AWSは、推論ワークロードの特性に合わせて、ロードバランシングの最適化や専用インスタンスタイプの設計など、様々な取り組みを行っています。AmazonBedrockを支える推論エンジンProjectMantleでは、リクエストの優先順位付けやリソース配分を最適化し、レイテンシを低減し、スループットを向上させています。
ベクター検索の重要性と進化
AI開発において重要な役割を果たすベクター検索にも注力。様々なデータタイプを共通フォーマットでベクター埋め込みできるNovaMultimodalEmbeddingsや、安価なストレージサービスAmazonS3でベクターデータを保存できるAmazonS3Vectorsを強化しています。AmazonS3Vectorsは、コストを最大90%削減し、20億ベクターで100ミリ秒という高速な検索を実現しています。
AI推論を加速するTrainium
AIの学習と推論を加速するTrainiumも進化を続けています。最新のTrainium3は、前世代モデルと比較して4.4倍の性能向上を実現し、AIワークロードの処理能力を大幅に向上させます。また、開発者がTrainiumのハードウェアを直接制御できるNKI(NeuronKernelInterface)を公開し、AIワークロードの最適化を支援します。
AWSは、AI時代においても、20年以上にわたって培ってきた技術基盤と、継続的なイノベーションによって、顧客のビジネスを支援し続けることを約束しています。
コメント一覧
まだコメントはありません。
← トップに戻る