第一部【企業情報】

第1【企業の概況】

1【主要な経営指標等の推移】

回次

第17期

第18期

第19期

第20期

第21期

決算年月

2020年3月

2021年3月

2022年3月

2023年3月

2024年3月

売上高

(千円)

819,128

887,565

756,568

633,998

734,975

経常利益

(千円)

273,236

288,424

109,742

22,409

81,960

当期純利益

(千円)

172,578

215,194

83,759

16,367

109,725

持分法を適用した場合の投資利益

(千円)

73,274

資本金

(千円)

149,471

151,481

151,481

151,481

100,000

発行済株式総数

(株)

5,138,000

5,168,000

5,168,000

5,168,000

5,168,000

純資産額

(千円)

1,047,934

1,232,022

1,279,605

1,191,058

1,300,784

総資産額

(千円)

1,189,149

1,352,003

1,354,931

1,393,512

1,710,046

1株当たり純資産額

(円)

208.84

244.06

253.49

240.72

262.89

1株当たり配当額

(円)

7.00

8.50

3.50

(うち1株当たり中間配当額)

(-)

(-)

(-)

(-)

(-)

1株当たり当期純利益金額

(円)

34.12

42.79

16.59

3.28

22.18

潜在株式調整後1株当たり当期純利益金額

(円)

33.71

42.64

自己資本比率

(%)

88.12

91.13

94.44

85.47

76.07

自己資本利益率

(%)

16.04

18.88

6.67

1.32

8.81

株価収益率

(倍)

32.27

48.03

55.27

392.68

40.40

配当性向

(%)

20.52

19.86

21.10

営業活動によるキャッシュ・フロー

(千円)

217,309

180,600

130,558

18,158

169,608

投資活動によるキャッシュ・フロー

(千円)

6,452

11,856

8,846

5,214

1,036,598

財務活動によるキャッシュ・フロー

(千円)

229,357

31,900

43,594

44,375

90,835

現金及び現金同等物の期末残高

(千円)

964,515

1,101,358

1,179,476

1,236,795

575,198

従業員数

(人)

40

44

51

53

56

(外、平均臨時雇用者数)

(10)

(15)

(16)

(17)

(9)

株主総利回り

(%)

49.5

92.6

41.8

58.4

40.9

(比較指標:配当込みTOPIX)

(%)

(90.5)

(128.6)

(131.2)

(138.8)

(196.2)

最高株価

(円)

2,324

3,750

2,238

1,780

1655

最低株価

(円)

960

1,065

706

579

701

(注)1.当社は連結財務諸表を作成しておりませんので、連結会計年度に係る主要な経営指標等の推移については

記載しておりません。

2.第17期、第18期、第19期及び第20期の持分法を適用した場合の投資利益については、関連会社を有していないため記載しておりません。

3.第20期及び第21期の1株当たり配当額及び配当性向については、配当実績がないため記載しておりません。

4.第19期、第20期及び第21期の潜在株式調整後1株当たり当期純利益金額については、潜在株式が存在しないため記載を省略しております。

5.従業員数欄の(外書)は、パート及び嘱託社員の年間の平均雇用人員であります。

6.最高株価及び最低株価は、2022年4月4日より東京証券取引所グロース市場におけるものであり、それ以前については東京証券取引所マザーズ市場におけるものであります。

7.「収益認識に関する会計基準」(企業会計基準第29号 2020年3月31日)等を第19期の期首から適用しており、第19期以降に係る主要な経営指標等については、当該会計基準等を適用した後の指標等となっております。

 

2【沿革】

当社の創業者である吉田大介が、株式会社国際電気通信基礎技術研究所に在籍していた際に、音声合成技術に出会

い、世の中に役立つ面白い技術であると直感しました。当時の技術は、まだ不完全ではありましたが、世の中に音声合成を普及させようと考え、当社を設立しました。当社は、音声合成エンジンの研究開発を進め、社内で開発した音声合成エンジンをベースに、様々な製品、サービスとして提供しております。

 

2003年4月

東京都文京区小石川に株式会社エーアイを設立

2007年4月

自由文音声合成エンジン「AITalk®」シリーズのライセンス提供を開始

2007年7月

京都府けいはんな地区に研究開発センターを開設

 

音声ファイル作成パッケージ「AITalk® 声の職人®」の販売開始

2008年2月

東京都港区芝へ本社移転

2009年9月

事業拡大に伴い、東京都文京区西片へ本社移転

2011年4月

事業拡大に伴い、東京都文京区本郷へ本社移転

 

コンシューマー向けパッケージ「かんたん!AITalk®」の販売開始

2011年11月

音声合成クラウドサービス「AITalk® WebAPI」の提供開始

2012年4月

オリジナル音声合成辞書作成サービス「AITalk® Custom Voice®」の提供開始

2014年2月

Japan Venture Awards 2014にて、「中小企業庁長官賞」を受賞

2014年4月

個人向け入力文字読上げソフト「VOICEROID®+ 琴葉 茜®・葵®」の販売開始

2014年5月

音響学会にて、「技術開発賞」を受賞

2014年9月

事業拡大に伴い、東京都文京区西片へ本社移転

2014年11月

東京都ベンチャー技術大賞にて、「大賞」を受賞

2015年10月

音声合成クラウドサービスを「AICloud®」としてリニューアル

2018年6月

東京証券取引所マザーズ市場に株式を上場

2018年10月

Nuance Communications,Inc.(現 Cerence B.V.)との技術提携に関する契約を締結

2019年1月

PowerPoint®専用ナレーションソフト「AITalk® 声プラス®」の販売開始

2019年9月

個人向け動画のナレーション・字幕追加ソフト「かんたん!アフレコ®」の販売開始

2019年10月

外国語ナレーションソフト「AITalk International®3」のリニューアル販売開始

2020年2月

個人向け入力文字読上げソフト「VOICEROID®2 伊織 弓鶴®」の販売開始

2020年5月

波形接続型音声合成方式とDNNパラメトリック音声合成方式を活用した「AITalk®5」シリーズ製品の販売開始

2021年2月

「AITalk®5」を活用した個人向けオリジナルブランド「A.I.VOICE®」の販売開始

2022年4月

東京証券取引所の市場再編に伴いグロース市場へ移行

2022年6月

創業者の吉田大介が取締役会長へ異動し、後任として廣飯伸一が代表取締役社長に就任

2023年3月

研究開発センターを閉鎖し、開発拠点機能を本社に集約

2023年5月

株式会社フュートレックとの資本業務提携契約を締結

2023年6月

株式会社フュートレックの株式を取得し関連会社化

2023年7月

コエステ株式会社の株式を取得し子会社化

2023年9月

コエステ株式会社を吸収合併

2023年10月

進化したDNN音声合成方式を活用した「AITalk®6」を発表

2023年12月

「AITalk®6」を搭載した個人向けオリジナルブランドの後継製品「A.I.VOICE®2」の販売開始

2024年1月

株式会社フュートレックと経営統合に関する基本合意書を締結

2024年5月

株式会社フュートレックと2024年10月1日を効力発生日とする合併契約を締結

 

3【事業の内容】

当社は、「エーアイは音声技術で社会に新しい価値をつくり続けます」を企業理念に掲げ、事業活動を行っています。

「音声技術」には、主に音声をテキスト情報に変換する技術(音声認識)、テキスト情報を音声に変換する技術(音声合成)、音声の声色を別の声色に変える技術(声質変換)、音声から話者を特定する技術(話者照合・話者同定)などがあります。これらの「音声技術」のうち、当社は設立以来、「音声合成」に特化して事業展開を続けています。当社では、日本語音声合成エンジンに関する研究開発から製品開発、販売、サポートを全て社内で行っており、「法人向け製品」「法人向けサービス」「コンシューマー向け製品」の提供を行っています。(詳細は、後述「(4)ビジネスモデル」をご参照ください。)

「音声合成」の研究開発の歴史は古く、18世紀末頃まで遡ります。以前から音声合成を知っている方にとっては、機械音、いわゆる「ロボットボイス」の印象を強く持っている方が多いかと思います。当社が提供している音声合成エンジンは、機械音ではなく、人の声で合成する「波形接続型(コーパスベース)音声合成方式」をベースに、独自に研究開発を行った音声合成エンジン「AITalk®」となります。また、2020年5月より提供を開始しました「AITalk®5」では、従来の「波形接続型音声合成方式」に加えて、現在の人工知能研究の中核をなす「深層学習」をベースにした「DNN * パラメトリック音声合成方式」の音声合成エンジンの提供を開始しました。( * DNN:Deep Neural Networkの略。人の神経回路網を数理モデル化したもの(ニューラルネットワーク)を多層化し、多様で複雑な辞書を表現することができる。近年の計算機資源の向上やビッグデータの登場により、その性能は飛躍的に向上した。)2023年10月には、さらに検証や新たな学習を積み重ね、品質改善を行った結果、より自然性の向上した音声合成「AITalk®6」を発表し、製品展開を進めております。

このような音声合成技術の向上に伴い、この十数年で音声合成エンジンの利用が拡がってきており、当社の音声合成エンジンを利用する顧客企業は、通信、防災、金融、鉄道・交通、車載、ゲーム、観光、自治体、図書館、放送局等、多岐に渡っております。(詳細は、後述「(3)主な活用シーン」をご参照ください。)近年では、IoT、ロボットの普及、また訪日外国人観光客の増加に伴い、音声認識と意図解釈を組み合わせた音声対話ソリューションや機械翻訳と多言語音声合成を組み合わせた音声翻訳ソリューションのような人工知能を用いた情報提供システムでの利用が拡がりを見せています。また、教育現場においては遠隔授業のための動画作成や、コンシューマーにおいてはユーザー生成コンテンツに音声合成が利用される機会が非常に増えており、音声合成技術がより身近なものとして浸透してきています。このように、音声合成技術の需要は今後もますます増加していくと考えております。

 

(1)当社の音声合成エンジン「AITalk®6」について

音声合成とはテキスト情報からその内容に即した音声波形を作り出す技術のことを言います。この技術は、テキスト情報を言語辞書に基づいて解析し、読み方やアクセント情報などを抽出・付与する「言語処理部」と、言語処理部で得られた解析結果から、音声辞書に基づいて音声波形を生成する「音声処理部」に分かれます。

当社の音声合成エンジン「AITalk®6」では、最新の言語辞書の利用に加えて言語処理部の解析アルゴリズムを改善することで、従来製品よりも高い解析精度を実現しています。また、音声処理部においては従来の「波形接続型音声合成方式」とともに「新DNN音声合成方式」を提供しています。それぞれ次のような特徴があります。

①波形接続型音声合成方式

波形接続型音声合成方式は、収録した音声波形をある音声単位に分解し、入力されたテキスト情報に合うように波形を繋げて任意の音声を合成する方式のことを言います。当社では、母音、子音の音素片に分解した素片辞書と、収録音声から抽出した韻律情報を機械学習によりモデル化した韻律辞書を使って実現しています。

合成時には、言語処理部の解析結果から韻律辞書に基づいて韻律情報を予測し、予測した韻律情報と言語処理部の解析結果から最適な素片を選択・変形・接続し合成音声を生成しています。この方式では、収録音声波形をそのまま利用するため、肉声感の高く、収録した人の特徴が表れた合成音声を作ることができます。

 

②新DNN音声合成方式

新DNN音声合成方式は、収録音声から抽出した音声の特徴を表した音響モデルを音声辞書化し、入力されたテキスト情報から音声辞書を用いて予測した音響特徴量を「ニューラルボコーダ」に与えることで音声を生成する方式のことを言います。従来の音声生成法である「ボコーダ」から「ニューラルボコーダ」に変更するをことで、より自然で肉声感のある音声を合成できるようになりました。また、新DNN音声合成方式では、ニューラルネットワークに韻律モデルと音響モデルを統合し、音素や時間フレームの情報を短期や長期で考慮する構造を採用することで、従来よりも自然な音声に近い音声特徴量を生成できるようになりました。

0101010_001.png

図 「AITalk®6」の概要

 

(2)「AITalk®」の特徴と当社の強み

当社の強みは、以下の4点になります。

①少ない収録音声

合成品質を向上するための一般的なアプローチは、音声収録数を増やすことです。一方で、音声収録数が増加することにより、収録時間が長時間に及び、また、音声辞書のサイズが大きくなりますので、音声辞書作成コストも増加します。当社では、少ない収録音声で高品質な音声合成を目指し、研究開発を進めており、一般的には、数10時間(数千~1万文章程度の収録)の収録時間を要するところ2時間~6時間程度(200~600文章程度の収録)の収録時間で音声辞書を作成することを実現しています。

 

②豊富な話者の提供

少ない収録音声で音声辞書を作成することを実現した結果、様々な音声辞書を提供する事が可能となり、本書提出日現在、日本語標準語の女性8話者、男性4話者、男の子2名、女の子2名、関西弁風の女性1話者、男性1話者の合計18話者を提供しております。

 

③Custom Voice(カスタムヴォイス)

従来は音声辞書の作成に数千万円の費用がかかっていたところ、少ない収録での作成を実現した結果、55万~500万円程度で作成することが可能となりました。その結果、特定の声優、ナレーター、キャラクター等、ご希望の音声辞書を安価に作成することにより、音声合成エンジンの利用範囲が大幅に拡がり、当社はこれまで400以上のCustom Voiceの作成を行っております。

 

④一気通貫での提供

音声合成エンジンを提供している競合他社は大手メーカーとなり、研究開発と製品開発あるいは販売が分離され

ています。当社においては、研究開発から製品開発、販売、サポートまでを全て自社内で対応しており、柔軟かつ迅速な対応を行える体制となっております。なお、外国語の音声合成エンジンについては、海外メーカーと提携し、展開しています。

 

(3)主な活用シーン

音声合成の品質向上に伴い、以前は、声優、ナレーターでの録音音声が利用されていた身近な様々なシーンにお

いて、音声合成エンジンの活用が拡がってきました。その様な状況の中、当社の音声合成エンジン「AITalk®」は、以下の様な様々なシーンにて活用頂いています。

①防災行政無線

防災行政無線、あるいは、全国瞬時警報システム(J-ALERT)にて、住民への放送用音声として、多くの自治体に活用頂いております。

 

②スマートフォン音声対話

スマートフォンにおける音声対話アプリの利用が拡大しておりますが、(株)NTTドコモが提供する「my daiz(マイデイズ)」、ヤフー(株)が提供する「Yahoo!音声アシスト」にて活用頂いております。

*「my daiz」は、(株)NTTドコモの登録商標です。

 

③ロボット

各社より様々なコミュニケーションロボットや業務用ロボットが提供されている状況の中、ソフトバンクロボティクス社が提供する「Pepper」や「Servi」、マツコロイド製作委員会が提供する「マツコロイド」等、多くのロボットにおいて活用頂いております。

 

④道路交通情報、カーナビゲーション

リアルタイムでの情報提供が必要となる道路交通情報、あるいは、全国の膨大な地点名を案内するカーナビゲーションにおいて活用頂いております。

 

⑤館内放送、駅構内放送

インバウンド向けの多言語を含め、駅、空港、商業施設におけるアナウンスとしてご利用頂いております。

 

⑥電話自動応答システム

図書館における電話による休館案内、銀行における電話自動応答システム、あるいはコールセンターにおける電話による自動案内等、電話自動応答システムとして幅広く活用頂いております。

 

⑦ホームページ読上げ

全国自治体、各企業のホームページの情報を音声で提供するツールとして活用頂いております。

 

⑧音声ファイル作成

eラーニング教材のナレーション、発券機等の機器におけるガイダンス、オーディオブック等で利用する音声ファイルを作成するツールとして活用頂いております。

 

⑨ゲーム

(株)セガ・インタラクティブが提供する競馬のアーケードゲーム「StarHorse」シリーズ、(株)タイトーが提供するアーケード用リズムアクションゲーム「テトテコネクト」を始め、ゲームのナレーション音声等で活用頂いております。

 

⑩コンシューマー向けパッケージ製品

当社オリジナルブランド「A.I.VOICE®」、(株)AHSから販売しております、「VOICEROID®」シリーズ等、コンシューマー向けパッケージ製品にて音声ファイル作成用途で活用頂いております。

 

⑪ニュース読み上げ

(一社)共同通信社が開発する「放送原稿読み上げシステム」のほか、各放送局においてニュースの読み上げ用途で活用頂いております。

 

⑫生成系AIとの連携

当社が提供するAIPal Chatをはじめとした生成系AIを用いた製品・サービスの発話機能として活用頂いております。

 

⑬オーディオブック

新エンジンによるより滑らかな音声の実現により、人の収録音声に代わる品質でオーディオブックに活用が進んでいて、作成のコスト低減とスピードアップが図れることから、オーディオブックの音声として活用頂いております。

(4)ビジネスモデル

当社は、音声合成事業の単一セグメントではありますが、「法人向け製品」「法人向けサービス」「コンシューマー向け製品」の3つの区分に分類しており、法人向けについては、顧客の特性に応じて、最適な製品またはクラウドサービスを提供しております。

①法人向け製品

<パッケージ販売:AITalk® 声の職人®・AITalk® 声プラス®・AITalk International®>

パソコンにテキストを入力するだけで、手軽に音声ファイルが作成できるパッケージソフトを販売しており、このソフトを使えば、誰でも簡単に直感的な操作で、高品質なナレーション音声を作成することができます。

 

0101010_002.png

 

図 「AITalk®5 声の職人S」の画面

 

<ライセンスの提供:AITalk® SDK・AITalk® Server・AITalk® micro>

当社の主たるビジネスモデルは、ライセンスビジネスとなります。具体的にはお客様と使用許諾契約書を締結し、音声合成エンジンをご利用頂く対価として許諾料を頂くことになります。なお、許諾料については、初期に基本ライセンス料として一時金を頂いた上で、ご利用用途に応じて、月額使用料、販売実績に応じたロイヤリティ等を個別に設定しております。顧客の用途に応じて、最適な音声合成エンジンをご提供しております。

 

<受託開発:AITalk® Custom Voice®>

顧客独自のオリジナル音声辞書を作成する場合には、受託開発として請け負っております。

 

<受託開発:音声ファイル作成サービス>

お客様がご用意する収録文章をもとに、当社の高品質音声合成でナレーション・ガイダンスを作成し、音声データを納品します。お客様の業務効率の向上の実現と、社会における音声活用機会の更なる拡大を目指します。

 

②法人向けサービス

<クラウドサービス:AICloud®シリーズ>

クラウド環境を活用した音声合成サービスの展開を進めており、インターネットを経由して以下のサービスをご提供しております。

・AITalk® WebAPI

WEBサービス等から音声合成エンジンを利用できるサービスで、手軽に音声合成を利用したサービスを開始する事ができます。

・AITalk® 声の職人® クラウド版

Webブラウザ上で、簡単に音声ファイルを作成できるサービスです。

・AITalk® Web読み職人®

ホームページにタグを埋め込むことにより、ホームページを読み上げるサービスです。

 

<A.I.VOICE® Biz>

簡単な操作で入力したテキストをキャラクターの自然な音声合成で読み上げ、音声ファイルとして作成することが可能です。また、WEB APIを利用する事でリアルタイムな音声合成が可能となり、アプリやWEBサービス、機器への組み込みにも利用できます。豊富なキャラクターラインナップのマテリアル(動画などに活用できる公式イラスト)を活用することができます。

 

<AIPal Chat powered by ChatGPT API>

簡音声対応AIチャットアシスタントです。会話データは学習に使用されないため企業の安全性が確保され、業務に合わせたテンプレートから対話を開始できます。

 

<コエステーションサービス>

コエステ株式会社の合併により加わった、多言語音声合成対応のクラウドサービスです。ビジネス形態に応じてWeb APIとエディターが選択でき、一般人から有名人まで多種多様な「コエ」を利用することができます。

 

<サポートサービス>

法人向け製品をライセンス提供しているお客様に対して、継続的に技術的なサポートサービスを提供しております。

 

③コンシューマー向け製品

<A.I.VOICE®シリーズ>

音声ファイルを簡単に作成することができるパッケージを販売しております。Shopify Japan 株式会社が提供するサービスを活用した当社の「A.I.VOICE®」公式サイト及び、BASE株式会社が提供するサービスを活用し当社が運営するネットショップ「A.I.VOICE」Official shopでの直販と、量販店、Amazon等の販売店を介した流通販売があります。直販においては、Shopify Japan 株式会社及びBASE株式会社に決済等の販売手数料をお支払し、流通販売においては、卸価格で提供しております。「AITalk®5」を活用した個人向けオリジナルブランド「A.I.VOICE®」及びその後継製品である「AITalk®6」を活用した「A.I.VOICE®2」として、主に以下を販売しております。

・A.I.VOICE®シリーズ 琴葉 茜®・葵®(日本語、英語、中国語)

声優「榊原ゆい」さんの声をベースにした、関西弁“風”の「琴葉 茜®」と、標準語のイントネーションで読み上げる「琴葉 葵®」の声で喋らせる事ができます。

・A.I.VOICE®シリーズ各キャラクター製品

当社が運営するキャラクターや既に各方面で活躍しているサードパーティ運営のキャラクター、コラボ企画により実現した製品等の各種キャラクターによるラインナップです。

・A.I.VOICE® for Games(Unity向けエディタ拡張)

ゲーム開発環境上で簡単に音声が作れるエディター拡張です。音声の一括作成/変更/修正などを手軽に行う事ができ、ゲーム開発時の音声管理が改善されます。

 

0101010_003.png

 

図 「A.I.VOICE®2 琴葉 茜・葵」の画面

 

<その他のコンシューマー向け製品>

音声ファイルを簡単に作成することができる以下のパッケージを販売しております。

・かんたん!AITalk®

誰でも文字を入力するだけで、簡単に高品質なナレーションが作成できる個人ユーザー向けパッケージソフトです。

・かんたん!アフレコ®

文字入力だけで、動画にナレーションと字幕を追加できる個人ユーザー向けパッケージソフトです。

・AITalk® あなたの声®

ご自身や大切な方の声を、音声合成技術で再現します。パソコンさえあれば、いつでも、どこでも、様々な言葉を喋らせる事ができるパッケージソフトで、Custom Voice®をセットにした製品となります。

・VOICEROID®シリーズ

好みの文章や言葉をテキストで入力するだけで、読み上げ・保存することができる入力文字読み上げソフトです。

なお、「かんたん!AITalk®」「かんたん!アフレコ®」は、販売店に販売を委託しており、「VOICEROID®」シリーズは、株式会社AHSから販売しております。

・からもるくじ

スマートフォンやPCから、いつでもどこでも手軽で簡単に、ハズレなしのオンラインくじが購入できるサービスです。人気キャラクターやアーティスト等のオリジナル商品があたるコラボくじが登場予定です。

 

 

[事業系統図]

事業系統図は以下のとおりであります。

 

0101010_004.png

 

4【関係会社の状況】

関連会社は次のとおりであります。

名称

住所

資本金

(千円)

主要な事業の内容

議決権の所有割合又は被所有割合

(%)

関係内容

株式会社フュートレック

(注)2

大阪市淀川区

100,000

音声認識・デジタルマーケティング・映像制作・その他

所有

40.6

資本業務提携

役員の兼任等

(注)1.「主要な事業の内容」欄には、セグメントの名称を記載しております。

2.有価証券報告書を提出しております。

 

 

5【従業員の状況】

(1)提出会社の状況

 

 

 

 

2024年3月31日現在

従業員数(人)

平均年齢(歳)

平均勤続年数(年)

平均年間給与(千円)

56

(9)

35.8

6.6

4,936

(注)1.従業員数は就業人員であり、パート及び嘱託社員は、年間の平均人員を( )外数で記載しております。

2.平均年間給与は、基準外賃金を含んでおります。

3.当社の事業は、音声合成事業の単一セグメントであるため、セグメント別の記載を省略しております。

 

(2)労働組合の状況

労働組合は結成されておりませんが、労使関係は円満に推移しております。