1. RoboStep TOP
  2. ロボット業界の今を学ぶ
  3. 利用広がる音声言語AI、主要中国企業の強みとは

2026.05.08

利用広がる音声言語AI、主要中国企業の強みとは

ここ数年で急激に技術革新や利用が広がっているAIですが、その応用の仕方は企業も消費者もまだ手探りであるようにも見えます。ただ簡単な質問や検索に応えるいわゆるチャットボット機能と、音声を識別して自動的に別言語へ翻訳したりテキスト情報に変換する音声言語機能は、既に生活の多方面へ浸透しており、一般消費者にとってなじみ深いのではないかと思います。

現在AI分野で世界をリードする中国においても、後者の音声言語AIに関して利用の拡大が続いています。BtoB、BtoCのどちらにおいても比較的収益化が図りやすい分野であることから競争も活発化してきており、市場状況も次第に形作られてきています。
そこで今回は、中国の音声言語AIの市場状況を紹介するとともに、現地報道に基づく技術動向についてもご紹介します。

担当ライター 花園祐(はなぞの・ゆう)

中国・上海在住のブロガー。通信社での記者経験を活かし、経済紙などへ記事を寄稿。独自の観点から中国のロボット業界を考察する。好きな食べ物はせんべい、カレー、サンドイッチ。

音声言語AIとは?

はじめに音声言語AIとはなにか、その定義について軽く触れておきます。

音声言語AIとは、DeepLなどテキスト情報の言語翻訳に特化した翻訳AIに対し、より音声の識別機能に特化した言語処理用AIを指します。その性能の評価指標となるコア機能としては以下の3機能が挙げられます。

●認識した音声を正確に聞き取る音声識別機能
●取得した音声内容を特定言語の意味ある内容として解析処理する言語処理機能
●出力した内容を自然な発音と文言で発声する発声機能

音声言語AIが使われている身近な製品としては、GoogleアシスタントやSiriが挙げられるでしょう。またスマートフォンなどに搭載される翻訳機能も音声言語AIの一種であり、議事録の自動録音、テキスト化ソフトウェアなどもこの類に属します。

既に上記のような一般家電製品にも幅広く応用されているほか、オフィスシーンでも活用が広がっており、AIの応用先としては比較的身近であると考えられます。応用範囲が広いことから比較的収益化しやすい技術と見られ、車載機器をはじめ今後のさらなる実装が期待されるなど将来性も高く、その精度と合わせ市場も拡大してきています。

市場規模、市場シェア状況

続いて、業界の市場状況を見ていきます。まず市場規模からみていくと、中国系シンクタンクの中国報告大庁によると、2024年における世界の音声言語AI市場規模は前年比23.1%増の525.6億元(約1.2兆円)で、順調な拡大を続けています。

市場シェアについても同じく中国報告大庁によると、世界市場では英Nuanceが31.6%のシェアでトップとなっており、この後をGoogle(28.4%)、Apple(15.4%)、Microsoft(12.0%)が続き、中国系の科大訊飛股份(科大訊飛、iFLYTEK(アイフライテック))が8.1%のシェアで5位に入ってきています。

一方、中国市場におけるシェアでは、世界市場シェアで5位のiFLYTEKが44.2%と半分近くのシェアを占め、検索大手の百度(Baidu)が27.8%で続き、両者で7割超のシェアを占めることとなります。その後はApple(15.4%)、Nuance(6.9%)、小i機器人(Xiao-i)(3.0%)という順番となっています。

以上の通り、音声言語AI市場は世界、中国市場ともにトップ企業の寡占率が非常に高く、上位2社がどちらも全体の過半数を占める状況となっています。技術障壁が高く、新規参入が難しいことがこうした寡占状況を生んでいると指摘されています。

各地方方言に対応する中国シェアトップのiFLYTEK

前述の通り、中国系のiFLYTEKが世界シェアで5位、中国シェアで1位となっています。この会社は恐らく日本では馴染みが薄いのではないかと思われますが、中国においては比較的知名度が高く、音声言語AI分野におけるリーディングカンパニーとして認知されています。

筆者も数年前より、同社のスマートフォン用音声言語AIアプリを活用しています。その他の音声言語アプリ同様、iFLYTEKのアプリもマイクに向かって発声した音声を文字として起こせるほか、リアルタイムで別言語にも翻訳してくれます。その対応言語数は現在、30カ国語超 に及びます。

実際に筆者が日本語で発声すると、発声した文言を毎回正確に中国語へ翻訳してくれており、その音声識別機能のみならず翻訳性能の高さにも目を見張ります。なお翻訳に関してiFLYTEKは、スマートフォン用アプリだけでなくICレコーダーと組み合わせた同時翻訳機も発売しています。

ただこうした外国語への対応以上にiFLYTEKのアプリで特徴的と感じたのは、対応している中国語における方言の種類の多さでした。

中国では広東語をはじめ、日本語とは比べ物にならないほど地域ごとの方言が非常に多い国です。その方言の差についても、隣り合う市でも相手の方言は聞き取れないほど隔絶が大きく、実際に中国人同士でも会話が通じ合わず、メールなどを介した筆談形式で意思疎通が図られる場面が時々あります。

このような言語の隔たりからか、農村部住民をはじめとして各地方の方言に対応した音声認識機能は中国では需要が高く、iFLYTEKもこの分野に力を入れています。実際にそのアプリ内の聞き取り言語の選択欄には「方言」の項目があり、河南語や四川語をはじめ中国各地方の方言が20種類超も用意されています。

密かに、こうした多種多様な方言への対応に迫られる土壌が、中国の音声言語AIの発達を促しているのではないかとも筆者はみています。


iFLYTEKアプリ上で選択可能な中国語方言種類(一部)

技術障壁が高く、プライバシー対策が重要に

以上、世界と中国の音声言語AI状況について簡単にまとめました。冒頭にも述べた通り、数あるAI分野の中でも音声言語AIは家電や車載機器などの音声インターフェースをはじめ、一般消費者にとっても比較的身近な技術分野です。これはいいかえるとBtoB分野のみならずBtoC分野で収益化が比較的容易でかつ応用範囲が広く、今後もさらなる拡大余地が残されていることを示しています。

この業界の特徴として中国の産業情報や研究レポートを提供する『中研網』も、技術障壁の高さと新規参入の難しさを指摘しています。現実に上位数社が市場の大半を握っており、音声識別の正確性も現在高水準で実現されていることから、これから参入してシェアを取ろうとなると難しいものがあるでしょう。

また今後の市況に関して筆者の立場から申すと、新規応用分野へ迅速に対応し、製品やサービスを供給できるかが鍵になってくるとみられます。ただその過程で重要となるのは、プライバシーをはじめとするコンプライアンス対応ではないかと睨んでいます。具体的には、どこまで会話を識別するかです。

既に一部で見られていますが、音声言語AIを搭載した機器が会話を聞き取り過ぎるという例が報告されています。意図しない会話や指示を聞き取り誤作動を起こすだけでなく、プライバシーを侵害する恐れも今後出てくるとみられ、この方面の対策が開発企業にも求められてくるでしょう。技術に対し倫理をどこまで立てるか、こうした議論が今後ますます大きくなるように思えます。

※本記事のメインパネルはGoogle Geminiを使用し作成しました。