向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
苏醒:“只要你自己还喜欢,去做就对了”******
2022文艺真心话
2022年的中国流行乐坛,一批“老人儿”再度走红,聚光灯外,引起人们的无限遐思:年长者如崔健、罗大佑、林子祥、叶倩文……开启了“爷青回”;年轻者如苏醒、陆虎等组成了“再就业男团”。
从“当红”到“翻红”,人生起伏,每一位重归聚光灯下的演员对生活与名利有了新的认识。岁月已逝,容颜已老,唯一不变的是好歌与实力。
曾经的“快男”,现在的“再就业男团”成员苏醒在接受记者专访时说:“人对于自己喜欢的事情,一直做就好了,先别管会不会被关注到,只要你自己还喜欢去做就对了。”
回头再看,这句话完美解释了2022年音乐圈里发生的这些故事,都与努力、坚持相关。当然,这也是苏醒自己的人生经验,以他的故事来为这句话做注解,再合适不过。
“热搜”迟到五年
2022年5月,苏醒和他的一首老歌《破亿》上了热搜。《破亿》是苏醒五年前发行的一首歌。
当时怎么想到写这样一首歌?其实创作的过程很简单,苏醒只是将自己出道这些年所经历的、所感、所想,用音乐的方式表达出来,又进行了艺术化的加工。对苏醒来说,这就是一次普通的创作,跟他创作其他歌曲的过程毫无区别,当时只是花了一个下午,或者更多的时间写出了歌词,其中不少内容是他此前看到、听到之后就记录过的。网友觉得歌词太过直白、露骨,但他却不认为歌词里提到的内容有任何负面,那就是一个客观存在。
歌曲出炉后,苏醒自己是有一点小得意的,觉得这首歌很有力量,但遗憾的是这首歌在当年并未掀起一片浪花。
苏醒当年并没有太在意,也不觉得有多遗憾,因为彼时他的音乐事业还未见起色,后来他总结:《破亿》的落寞,是因为“人糊”,而非作品差,“人糊不能怪歌,作品是无辜的”。
2007年,23岁的苏醒参加湖南卫视选秀节目《快乐男声》,取得西安赛区冠军、全国总决赛亚军的成绩,赛后签约天娱传媒,发专辑、演话剧、办巡演,可谓出道即巅峰,但后来的发展却不尽如人意。
“人糊”的这几年,苏醒在微博晒简历找工作,在线呼吁“谁有活儿,带带我”,网友便调侃“我是来晚了,还是你糊了?”苏醒搞笑回复自己是“糊咖”。
对于那段出道即巅峰的岁月,苏醒从不曾怀念,唯一怀念的是自己的青春、与青春有关的一切:比较瘦、跳得高、跑得快、体力好。
五年后“糊咖”苏醒当时无人问津的《破亿》引发关注,他自己也没想到。这首歌再度发表的当口,正是苏醒和几位当年的快男一起上了一档综艺节目引发关注之时。他说“就要趁着有流量的时候拿出来”,事实证明,时机真的很重要,这个决定,做对了。
自得其乐却从未躺平
《破亿》登上热搜后,苏醒又录了一条视频,先是说《破亿》热度上来后,再就业男团的其他人表示“必要时可以放弃苏醒”。然后让粉丝安心,说应该不会出现“今天是我粉苏醒的第一天,明天他就退出娱乐圈”的情况。
事实上,这些年苏醒从未躺平,即使处在低谷之中,也依然在认真写歌、拍摄短视频,提升自己的专业素养。沉寂的时候,他在线呼吁“谁有活儿,带带我”可能并不仅仅是一句调侃,但心态上他并不着急,也不是不够上进,可能只是火候没到。
有时候连苏醒的经纪人都着急,觉得苏醒太过“佛系”,但苏醒永远懂得掌握自己的节奏。他说,机会没到的时候,或者火候还不够,就不用想那么多,该做什么还做什么,即使一直都没有等到机会,也没什么大不了,但如果机会来了,说明一直以来的努力没有白费,总会有人看得到。就像歌手刘畊宏,健身已经好多年,并不是谁看到、关注的时候才开始的。
由此苏醒得出了一个结论,希望和大家共勉:“所以人对于自己喜欢的事情,一直做就好了,先别管会不会被关注到,只要你自己还喜欢去做就对了。”
“再就业男团”翻红
2019年,2007届快乐男声成员苏醒、王栎鑫、张远、陈楚生、王铮亮、陆虎参加一档节目叫《合唱吧300》,为团队取名“再就业男团”。当时几位成员确实处在就业机会没那么多或者条件没那么好的状态,来录节目有点像“再就业”,于是取了这样一个名字。
2022年,“再就业男团”又携手走进综艺节目《欢迎来到蘑菇屋》,当时苏醒依然没有其他工作安排。他们自嘲为“糊咖”聚首,却意外爆火。
六位艺人在镜头前的重聚,勾起了无数人的青春记忆。几位老友互嘲逗趣的场面既搞笑又温馨,节目收视超出预期,“再就业男团”因此翻红,并且被称为“顶流”。但自称“初代流量”的苏醒并未因此沾沾自喜,这几位以苏醒为代表的经历过大风大浪的“老炮儿”对于“顶流”、“热搜”都看得很明白:热度持续一两个月算不错了,你能上热搜也随时能下去。
《破亿》的热搜事件后,王栎鑫曾仗义喊话:你下次再被封杀了我就带你一起去带货。当然这只是一句调侃、玩笑话,但即便真如王栎鑫所说“被封杀”离开演艺圈,苏醒也不担心自己会失业。苏醒自认为除了音乐,还有编剧的才能,拍短视频,做广告营销都是他在行的。“实话实说,我不担心好像我今天如果不做艺人就没饭吃了,找个班上也不是不行。”
但这世上只有现实,没有如果,所以从2007年到2022年,不管境遇如何,苏醒从没放弃过。还有很多人也在追梦的路上坚持着,因为他们一直相信:人对于自己喜欢的事情,一直做就好了,先别管会不会被关注到,只要你自己还喜欢去做就对了。(文/记者寿鹏寰 统筹/满羿)