课程
首页 > 全部课题 >深度学习中的多模态学习>
深度学习中的多模态学习
深度学习中的多模态学习
本课题将研究多模态深度学习算法的关键问题,包括跨模态信息对齐、联合表征学习及高效推理方法,尤其在医学、教育等领域的应用场景下展开研究,旨在推动多模态学习的发展,为解决复杂任务提供更强大的工具和方法。
工科
SCI
CCF
计算机科学与技术
人工智能
深度学习
多模态
申请匹配
咨询客服
课题详情

【课题推荐发表期刊】

乔梦云 3个.png


【课题背景】

多模态学习旨在融合不同类型的数据(如图像、文本、时间序列)以提升模型对复杂任务的理解能力。跨模态信息对齐是多模态学习的核心任务之一,其目的是使不同模态的数据在时空和语义上能够相互关联。它通过结合多种模态的数据,弥补单一模态的不足,从而获得更全面的感知和理解能力。

本课题将研究多模态深度学习算法的关键问题,包括跨模态信息对齐联合表征学习高效推理方法,尤其在医学、教育等领域的应用场景下展开研究,旨在推动多模态学习的发展,为解决复杂任务提供更强大的工具和方法。


【课题方向参考】

  • 设计一种基于变换器(Transformer)的多模态学习框架,实现对图像与文本数据的高效对齐。

  • 开发一种轻量化的多模态模型压缩算法,优化在边缘设备上的实时推理能力。

  • 探索多模态数据间的不确定性建模,提升模型在噪声数据下的鲁棒性

  • 临床诊断,报告生成。


【适合人群】

本科以上,会使用python


【课题收获】

  • 高质量论文一篇(SCI/CCF定向期刊

  • SCI/CCF期刊投递与发表指导

  • 结业证书


【导师介绍】

Dr. Zhou,C9高校计算机博士,QS10高校博士后

  • 累计发表发文总数30+,SCI一区15+(Nature子刊,TMI,MEDIA等),其中第一作者12篇,包括计算机科学和医学方面的出版物:MICCAI(医学成像顶级计算会议,CORE排名A),Nature Cardiovascular Research, IEEE Transactions on medical imaging (TMI), Medical Image Analysis (MEDIA)(医学成像顶级期刊)

  • H-index: 13(截至2025年1月4日)

  • 担任MICCAI 2022-2024(医学影像领域顶级计算会议,核心A级)、TMI、MEDIA、Scientific Reports、MICS、CSUR(医学影像领域顶级期刊)审稿人

  • 辅导过10-15名学生,辅导学生发过SCI文章、CCF B论文、毕业论文,成功率100%

  • 擅长给一个idea,引导学生自我启发,从实验到发表,完成整个项目

  • 可提供课题基金申报指导、保研指导、申博指导、海外高校申请指导;可提供开源代码并指导复现;可提供部分开放研究数据;可撰写推荐信;期刊内推资源;就业/实习机会推荐


【课题安排】

研究周期预估六个月左右,具体视学员情况调整。

课题安排.png

 

【推荐阅读】

2024 Application of multimodal deep learning and multi-instance learning fusion techniques in predicting STN-DBS outcomes for Parkinson's disease patients

2025 Application of deep learning-based multimodal fusion technology in cancer diagnosis: A survey

2025 Multi-scale multimodal deep learning framework for Alzheimer's disease diagnosis

课题导师 查看详情 >
Dr.Zhou KY33566
C9高校计算机博士,QS10高校博士后
大语言模型多模态网络医学影像自然图像数字孪生
业务咨询
刘老师:18922434589
商务合作
石老师:13922152147
客服邮箱:customer_services@ais.cn
举报受理
电话:400-607-9388
邮箱:customer_services@ais.cn

公众号

小程序

广州科奥信息技术股份有限公司 版权所有。
Copyright©2019 All rights reserved 粤ICP备16087321号