研究项目
生成式人工智能赋能现代课堂教学与新形态教材建设
生成式人工智能正在显著提升现代课堂教学的质量和效果。通过自动生成多样化的教学材料、个性化的学习方案和即时反馈,生成式AI帮助教师更有效地因材施教。此外,它还能通过模拟对话和互动练习增强学生的学习体验,使他们在沉浸式的环境中更加主动地参与到学习过程中。这种技术的应用不仅提高了教学效率,还促进了学生的自主学习能力和创新思维的发展。 
基于多模态交互的抑郁症评估系统研究
在我国西部地区,留守儿童问题突出,大量青少年儿童缺乏关怀,导致自信心不足,进而引发抑郁等心理问题,带来了极大的心理健康检测需求,但目前我国精神科医生严重短缺,特别是在西部地区,资源分布不均衡,加剧了挑战。因此,迫切需要基于人工智能等技术的抑郁症诊断系统,提升诊断效率,更好地应对挑战。目前,这方面的研究仍处于起步阶段,需要进一步深化和完善。本项目旨在开发一套基于数字人辅助的抑郁症诊断系统,重点研究多模态感知数字人在抑郁症识别分析及情感解析方面的应用。通过结合人工智能心理医疗大语言模型和深度学习技术,本项目将探索数字心理医生的建模与驱动机制、多模态数据的特征提取与融合方法以及基于人工智能和深度学习的抑郁症检测技术等关键科学问题。项目预期成果包括建立一个基于虚拟数字人的心理诊断交互系统(MindSense),为医生提供快速且全面的识别诊断建议。这将对预防和治疗心理健康疾病,提高我国居民的心理健康水平具有重要意义。
重大疫情背景下的舆情特点及应对研究
本课题旨在通过大数据、人工智能、区块链等信息技术手段,解决传统舆情应对体系中无法实现的对信源、内容、渠道、效果的实时精确监测分析,构建并完善新技术支撑下的重大突发性公共卫生事件舆情预警研判应对引导体系。按照“总—分—总”即“把握特征规律——技术操作路径——整体解决方案”的思路分为五个子课题: 子课题一:重大疫情的舆情特征与信息传播规律研究 子课题二:基于大数据技术的疫情信息传播路径及效果实时分析 子课题三:基于人工智能技术的疫情信息自动识别与鉴伪 子课题四:基于区块链技术的疫情信息发布确权认证与溯源 子课题五:重大突发性公共卫生事件的舆情风险防控体系构建  (四川省社会科学研究规划重大项目2020,项目编号:SC20YJ005)
基于多退化模型的超高清视频图像质量增强技术
       由于造价、设备更新周期、便携性需求、传输带宽等因素的限制,高清(1080p)乃至更低分辨率的视频内容仍被广泛使用,导致目前超高清视频(4K/8K)数据来源非常有限。与此同时,超高清视频内容在各领域被广泛需求,例如:视频监控与分析、网络视频传播、个人移动终端拍摄等等。因此,将高清/标清视频转化为超高清视频具有重要的现实意义。数字视频超分辨率(VSR)算法是实现上述转化的有效技术手段。现有VSR算法往往局限于实验室仿真数据的研究,相较于真实视频内容,仿真数据中的高清-低清退化关系已知且模式单一,导致先验假设过强,难以符合真实场景的需要。 (四川省科技计划-重点研发项目,项目编号:2020YFG0149)
智能机器人视觉智能
       从目前家庭智能设备的发展状况来看,大部分智能设备仍只是为“伪智能”设备,仅通过wifi通信模块提供了基础的联网控制。目前,多数的家庭智能设备的重点都在设备及硬件连接上。然而,真正的智能家庭设备不仅仅是实现通信连接,而更要在人与设备之间的交互上不断进化。视觉感知为人机交互打开了新世界的大门。为了让家庭设备具备人类视觉认知的能力,人工智能则是无法避开的话题。通过人工智能的关键技术,让智能家庭设备融入家庭生活,成为家庭中的一名成员,实现真正的智慧家庭。(长虹自由创新项目)
基于边缘计算的移动云端内容识别
        人工智能技术的快速发展,其大量应用于图像识别方向,协助人们识别分析许多人类无法识别的对象。目前,多数的识别算法依赖于高性能图形处理计算机,难以真正用于日常消费市场。然而,随着4G通信技术的发展,通过移动手机端收集获取数据,发送至云端服务器进行处理并返回给手机端的方式为图像识别技术应用于日常消费市场提供了解决方案。在日常生活中,人类能够分辨出动物类别的数目有限,这时就需要计算机提供帮助。但是,由于不同动物之间存在相似性,并且在不同光照条件、不同角度下,计算机难以提取到有效特征,容易造成识别错误。因此,一个有高精度的识别准确率和适用于多种使用场景的通用识别算法十分关键。同时,基于深度学习的动物识别算法需要大量的动物图像数据进行训练,在有限的数据的情况下,一个具有广泛表达能力的模型也是至关重要的。因此,本项目基于深度学习的常见动物识别模型,结合云端服务器,实现实时的云端常见动物识。(酷派手机创新项目)
基于空间多模式预测模型的智能视频预测编码
        随着多媒体终端的广泛普及,数字视频作为信息传播的重要载体在传播先进文化、保障社会安全、革新社交方式等诸多方面发挥着必不可少的作用,与此同时也产生了海量的数据,导致存储成本的急剧增加。以用户生成内容的视频网站以及城市监控记录为例, YouTube 视频网站每分钟由用户上传的总时长已超过 300小时,覆盖我国的监控设备数量也已经超过四千万台,其产生的视频数据所需的存储成本将高达万亿元。在此情况下,视频压缩效率的提升将节省数千亿元的费用。因此,高效的视频压缩编码算法是视频通信领域的重要研究内容之一。在视频压缩编码算法已被广泛研究数十年的情况下,如何在有限的复杂度内,实现压缩性能(BD-RATE)的持续性提升是高效视频压缩编码算法研究所面临的主要难题。 (四川省科技厅应用基础研究项目,项目编号:2018JY0610)
基于多尺度深度学习的阿尔法通道预估算法研究
       前景物体的提取是计算机视觉领域的基础性问题,其准确度极易受到背景环境、颜色概率分布、光影条件以及噪声等因素的影响。本课题旨在设计适应复杂条件的精确前景分割方法,通过模拟人类视觉感知特性,利用深度学习理论构建自适应的图像结构分析模型,克服前/背景特征混叠以及特征空间连续不可分的理论难题,从而精确稳定地分割前景区域。主要研究内容有:1)基于阿尔法通道预测算法建立前景物体数据库;2)利用多尺度图像形态提取算子对自然图像的特征建模;3)利用神经网络分析图像特征模型的参数,确定不同图像特征在前景物体分割时的作用机理,提出适合各种图像场景的自适应前景物体提取算法;4)通过实验仿真,验证完善前景分割模型在不同图像内容下的有效性。本项目结合深度学习和阿尔法通道预测的理论基础,从新的角度出发,富有一定的前瞻性与挑战性,对于前景提取技术应用于复杂环境的军事与电子系统,具有重要的现实意义。(国家自然科学基金青年科学基金项目,项目编号:61701094)