从视觉智能看AI发展与变迁

11月23日,佳讯飞鸿技术论坛在北京交通大学圆满召开。中国科学院计算技术研究所山世光研究员受邀出席分享《从视觉智能看AI发展与变迁》。

智能科技驱动行业创新
北京佳讯飞鸿电气股份有限公司是一家专注于通信、信息领域的新技术及新产品的自主研发与生产,并实现规模销售的通信设备及解决方案提供商,产品成功应用于铁路、城轨、国防、能源、电力、海关等众多行业。随着物联网、大数据、云计算、无人系统等新技术的开发应用,佳讯飞鸿将助力智慧城市的建设,为世界和中国的城市发展贡献自己的智慧。
为推动技术创新,构建开放的产学研用生态圈,实现智能化升级,佳讯飞鸿自2017年开始举办技术论坛。
本届论坛在北京市发展和改革委员会的指导下,由先进轨道交通智慧指挥调度技术国家地方联合工程实验室主办,佳讯飞鸿智能科技研究院承办,北京佳讯飞鸿电气股份有限公司携手北京市高速铁路宽带移动工程技术研究中心共同协办。

论坛聚焦“智能科技驱动行业创新”主题,来自轨道交通、通信信息、人工智能等领域的政府领导、权威专家和行业代表齐聚一堂,共同研讨技术创新和应用创新的前景。北京市发展和改革委员会高技术产业处副处长周昊出席论坛并致辞,佳讯飞鸿董事长林菁参加论坛并做主题演讲,中科院计算所山世光研究员,中国信息通信研究院科技委主任蒋林涛,北京交通大学轨道交通控制与安全国家重点实验室通信方向首席教授钟章队,国铁集团工电部主管姜永富,北京大学教授赵东岩,中铁上海设计院集团有限公司通信所副所长柏锋等业内权威学者发表精彩演讲。

山世光研究员发表演讲《从视觉智能看AI发展与变迁》,深度分析视觉智能的进步与趋势、人工智能水平与方法论的变迁,详细阐述从看脸到读心:深刻理解人的视觉技术。
视觉智能的进步与趋势
山世光研究员表示近几年视觉智能发展迅速,视觉识别、回归、估计、分割任务,基于GAN的图像与视频生成, 视觉与语言的联姻,工业视觉检测都取得了叠加式进步:
得益于百万人、亿级规模人脸图像的特征学习,人脸识别错误率达到2-4个数量级的下降;视频结构化分析已经能够对图像视频中的人、车属性进行性别、年龄、车型等细致的判断分析;基于计算机视觉不仅可以生成逼真的图像、视频,还可实现看图作文、视觉问答VQA等;工业视觉检测步入深度学习时代,适用于各类缺陷检测(产品质量控制)和生产安全检测。例如利用无人机检测电塔零部件,分析零部件缺陷;对生产行为进行规范性检测,发现不合规行为立即报警等等。
山世光研究员认为全面机器学习化、场景应用定制化是视觉智能的现状,图像与视频生成、视觉与语言联姻是当前热点,高效经济的数据获取与标注是落地应用的关键。视觉智能正逐渐渗透到各行各业,尤其是在高重复性、高风险、高复杂性的场景,用摄像头+算法替换人工,能够降低风险,提高效率。
人工智能水平与方法论的变迁
山世光研究员详细讲解了AI智能水平变迁的7个趋势和AI实现路径变迁的10个趋势,为视觉智能的未来提供了极具指导价值的观点:
1、AI智能水平变迁:
从浅层感知(看、听、说)到认知和理解;从单模态智能到多模态(融会贯通);从静态智能到动态行为智能;从硅基智能到碳硅铁混合智能体;从纯智商到有点情商,即从识面到读心;从临摹艺术到艺术创作;从不自知到有点自知之明(某种意义上的自我意识)。
2、AI实现路径的变迁:
从GPU通用算力设备到专用算力设备/芯片,芯片算力不断提高;从强大数据驱动的算法到小数据驱动的算法;从纯数据驱动的机器算法到知识和数据联合驱动类人算法;从黑盒子算法到可解释、懂因果的算法;从被动学习智能到主动学习智能;从单任务专用算法到多任务通用算法再到元方法;从学习特定算法的参数到自动学习算法及其参数从一次性学习到终身学习;从端侧智能到按需取用的云端智能(类似水电煤);从专用开发工具到低门槛开发工具(AutoML等)。
从看脸到读心:深刻理解人的视觉技术
关于“视觉读心术”,山世光研究员认为从看脸时代发展到读心时代,算法会在心理和精神层面越来越深刻理解人类。尽管“视觉读心术”发展稳中有进,但是仍然面临着数据获取涉及隐私伦理问题、数据与领域知识融合等挑战。
“视觉读心术”基于人脸识别进行“察言观色、望闻问切”,能够测量心率、呼吸、眨眼率、视线、唇读等生理指标,还能够检测表情、微表情、面部动作单元、正向/负向情绪、疲劳、专注/分神等心理状态,更能辅助抑郁、自闭症等精神状况诊断,广泛应用于人机交互、安全驾驶、人格画像、精神性疾病等医疗检测。
联手共拓智能时代
未来,中科视拓将携手佳讯飞鸿,在图像识别领域展开合作,双方将结合现有技术优势,共同拓展智慧城市、智能电力、智慧安防等多个领域,让人工智能的颠覆性创新在产业转型升级、新旧动能转换上更具实用价值。
—END—