日本音響学会第155回(2026年春季)研究発表会でB4の山川優綺さんと上乃聖先生が発表を行いました
3月17日~3月19日開催の日本音響学会第155回(2026年春季)研究発表会で以下の内容について、B4の山川優綺さんと上乃聖先生が発表を行いました。
「LLM-based 音声合成における連続性を考慮したビームサーチ」 著者:上乃 聖,李 晃伸(名古屋工業大学大学院)
「大規模モデルを用いた演じ分けに着目した落語音声合成」 著者:山川 優綺,上乃 聖,李 晃伸(名古屋工業大学)
李研究室では、音声および言語を用いた人対人・人対機械のコミュニケーションを対象として、音声認識・音声対話・自然言語処理・音声インタラクション・アバターコミュニケーションに関する研究を行っています。機械による音声・言語・対話処理を軸とした知的情報処理(いわゆるAI)の技術発展、ならびに万人にとってより自然で使いやすい声やことばによるマンマシンインタフェースの高度な実現を目指して、理論に基づくものづくり、モノづくりの知見による理論の推進の両面を重視しながら、身近な話題から最新のトピックまで様々な研究に取り組んでいます。
李研は酒向研究室と共同で研究室を運営しています。また徳田・南角・橋本研究室と協力関係にあります。

名古屋工業大学 教授
1998年京都大学大学院修士課程修了.2000年同大学院情報学研究科博士課程短期修了.同年奈良先端科学技術大学院大学情報科学研究科助手.2005年より名古屋工業大学大学院工学研究科助教授,2007年,同准教授.2016年,同教授。主として音声言語理解・音声認識・音声対話システム・アバターコミュニケーションの研究に従事.博士(情報学).JSPS科研費,JST CREST,内閣府ムーンショット型研究開発等の研究開発プロジェクトおよび多くの共同研究に従事.電子情報通信学会,情報処理学会,日本音響学会,人工知能学会,ISCA,IEEE各会員.
コーディングを愛し、オープンソース活動に長年従事。 以下のオープンソースソフトウェア・CGアバターの主開発者でもある。
3月17日~3月19日開催の日本音響学会第155回(2026年春季)研究発表会で以下の内容について、B4の山川優綺さんと上乃聖先生が発表を行いました。
「LLM-based 音声合成における連続性を考慮したビームサーチ」 著者:上乃 聖,李 晃伸(名古屋工業大学大学院)
「大規模モデルを用いた演じ分けに着目した落語音声合成」 著者:山川 優綺,上乃 聖,李 晃伸(名古屋工業大学)
3月9日~3月13日開催の言語処理学会第32回年次大会(NLP2026)で以下の内容について、M2の鈴木香保さんと金子優君が発表を行いました。
「発散・深掘り対話戦略に基づくLLM対話システムによる悩みの内省支援」 著者:鈴木 香保,上乃 聖,李 晃伸(名古屋工業大学)
「両価性の気づきの促進を重視する動機づけ面接システム」 著者:金子 優,上乃 聖,李 晃伸(名古屋工業大学)
2月27日~2月28日開催のHAIシンポジウム2026で以下の内容について、B4の稲葉響さんが発表を行いました。
「音声対話エージェントにおけるCGらしさと人間らしさを統合したふるまい表現」 著者:稲葉 響,上乃 聖,李 晃伸(名古屋工業大学)
12月1日~12月5日開催の第6回日米音響学会ジョイントミーティングで以下の内容について、D1の市川奎吾君、M2の岡本海君、嶋崎純一君、M1の鈴木萌々音さんが発表を行いました。
「Multi-talker conversational speech generation for training speaker diarization model via text-to-speech」 著者:Keigo Ichikawa,Sei Ueno,Akinobu Lee(Nagoya Institute of technology)
2025年11月15日(土)・16日(日)に開かれる名古屋工業大学祭「工大祭2025」の企画として、李研から遠隔会話 CG アバターシステムを展示します。操作体験コーナーもあり、アバター越しの会話を体験いただけます。
11月4日~11月9日開催のEMNLP2025で以下の内容について、M1の箕成侑音君が発表を行いました。
「TRPG Game Mastering Using LLM-Based Multi-Agent System」 著者:Yukito Minari,Sei Ueno,Akinobu Lee(Nagoya Institute of Technology)
10月22日~10月24日開催のAPSIPA2025で以下の内容について、M2の岡本海君が発表を行いました。
「Face-conditioned Large-scale Text-to-Speech via Speaker Embedding Prediction from Facial Images」 著者:Umi Okamoto,Sei Ueno,Akinobu Lee(Nagoya Institute of technology)
3月17日~3月19日開催の日本音響学会第153回(2025年春季)研究発表会で以下の内容について、M2の市川奎吾君、B4の鈴木萌々音さん、上乃聖先生が発表を行いました。
「話者遷移確率に基づく話者ダイアライゼーションのためのデータ生成」 著者:市川 奎吾,上乃 聖,李 晃伸(名古屋工業大学)
「音響情報を考慮した大規模言語モデルによる音声認識の誤り訂正」 著者:鈴木 萌々音,上乃 聖,李 晃伸(名古屋工業大学)
「拡散モデルを用いた音声合成による音声認識のデータ拡張」 著者:上乃 聖,李 晃伸(名古屋工業大学)
3月10日~3月14日開催の言語処理学会第31回年次大会(NLP2025)で以下の内容について、B4の箕成 侑音君が発表を行いました。
「LLM ベースのマルチエージェントによる TRPG ゲームマスターシステムの実現」 著者:箕成 侑音,上乃 聖,李 晃伸(名古屋工業大学)
2月28日~3月1日開催のHAIシンポジウム2025で以下の内容について、M2の川又朱莉さんと藤岡侑貴さん、B4の鈴木颯真君と𠮷田拓実君、山田航暉君が発表を行いました。
「身体性を持つCG対話エージェントにおけるカートゥーン調表現の方法論および比較評価」 著者:川又 朱莉,上乃 聖,李 晃伸(名古屋工業大学)
「CGアバター遠隔対話のための音声からのモーション生成およびCG特有性の分析」 著者:藤岡 侑貴,上乃 聖,李 晃伸(名古屋工業大学)
「アバター会話支援のための音声からのリアルタイム会話モーション生成の検討」 著者:鈴木 颯真,上乃 聖,李 晃伸(名古屋工業大学)