CGアバターのVRM版の公開を開始
VRoid Hub にて CGアバターの VRM 版の公開を開始しました。
現在「ジェネ」「うか」を一般公開しており、VRoid Hub 対応ツールより自由に利用可能です。
李研究室では、音声および言語を用いた人対人・人対機械のコミュニケーションを対象として、音声認識・音声対話・自然言語処理・音声インタラクション・アバターコミュニケーションに関する研究を行っています。機械による音声・言語・対話処理を軸とした知的情報処理(いわゆるAI)の技術発展、ならびに万人にとってより自然で使いやすい声やことばによるマンマシンインタフェースの高度な実現を目指して、理論に基づくものづくり、モノづくりの知見による理論の推進の両面を重視しながら、身近な話題から最新のトピックまで様々な研究に取り組んでいます。
李研は酒向研究室と共同で研究室を運営しています。また徳田・南角・橋本研究室と協力関係にあります。

名古屋工業大学 教授
1998年京都大学大学院修士課程修了.2000年同大学院情報学研究科博士課程短期修了.同年奈良先端科学技術大学院大学情報科学研究科助手.2005年より名古屋工業大学大学院工学研究科助教授,2007年,同准教授.2016年,同教授。主として音声言語理解・音声認識・音声対話システム・アバターコミュニケーションの研究に従事.博士(情報学).JSPS科研費,JST CREST,内閣府ムーンショット型研究開発等の研究開発プロジェクトおよび多くの共同研究に従事.電子情報通信学会,情報処理学会,日本音響学会,人工知能学会,ISCA,IEEE各会員.
コーディングを愛し、オープンソース活動に長年従事。 以下のオープンソースソフトウェア・CGアバターの主開発者でもある。
VRoid Hub にて CGアバターの VRM 版の公開を開始しました。
現在「ジェネ」「うか」を一般公開しており、VRoid Hub 対応ツールより自由に利用可能です。
2024年度修士中間発表でM2の川又朱莉さんと木全亮太朗さんが日本音響学会東海支部優秀発表賞を受賞しました。
12月3日~12月6日開催のAsia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2024) で以下の内容について、M2の市川奎吾君が発表を行いました。
“Data generation for speaker diarization by speaker transition information” Keigo Ichikawa, Sei Ueno, and Akinobu Lee
9月18日~9月20日開催のHISシンポジウム2024で以下の内容について、M2の柄澤光一朗君が発表を行いました。
「複数のLLMに基づく車室内音声対話のためのコーパス収集システム」 著者:○柄澤 光一朗,李 晃伸(名古屋工業大学), 神沼 充伸(東京国際工科専門職大学)
第34回マイクロエレクトロニクスシンポジウム(MES2024)において、11日に上乃聖先生が「音声情報処理における機械学習」と題して招待講演を行いました。
9月4日~9月6日開催の言語処理学会若手支援事業第19回(YANS2024)で以下の内容について、M1の齋藤大輔君と金子優君、酒井健壱君、B4の箕成侑音君が発表を行いました。
「大規模言語モデルによる感情極性に着目した小説からの人物関係抽出」 著者:○齋藤 大輔,上乃 聖,李 晃伸(名古屋工業大学)
「動機づけ面接におけるクライエントの発話分類に基づく応答生成」 著者:○金子 優,上乃 聖,李 晃伸(名古屋工業大学)
9月4日~9月6日開催の日本音響学会第152回(2024年秋季)研究発表会で以下の内容について、M2の木全亮太朗君が発表を行いました。
「大規模事前学習モデルによる笑い声表現を用いたspeech-laugh音声の生成」 著者:○木全 亮太朗,上乃 聖,李 晃伸(名古屋工業大学)
2024年4月に新たに以下のメンバーが李・酒向研究室に配属され、歓迎会を行いました。