专业炒股配资门户 微软亚洲研究院副院长邱锂力:无线通信和感知与AI大模型正双向赋能
http://www.goodgongshi.com/tongdaxingongshi/109636.html专业炒股配资门户
提到大模型,人们已经不再陌生,多模态的大模型从吟诗作画扩展到提升娱乐体验和工作效率。但在微软亚洲研究院副院长、微软亚洲研究院(上海)负责人邱锂力看来,大模型还可以做得更多。
增加大模型可理解的模态种类
“AI技术已经能处理不同的数据模态,如文本、图片、视频和语音。然而,要支持医疗等不同行业的特定应用,我们还需处理更多如生理信号、无线感知技术,包括WiFi、毫米波和激光雷达等不同于传统模态的数据。我们致力于更好地支持这些新模态,并探索如何将它们与传统模态结合,这一领域有巨大的发展潜力。”在提到大模型的相关应用时,邱锂力关注的是先让更多模态的数据可以被大模型理解。
作为无线通信领域的专家,她和团队在无线技术领域的研究主要是增强信号、提高速率,并开发传输和感知的算法。
她给第一财经在内的媒体记者展示了几块不到A4纸大小的轻薄板子,还有几块像乐高堆叠而成的塑料板。这些就是颇为神奇的“超表面”——这是一种具有人工设计结构的二维材料,通过设计每个超表面的单元,能精准修改射波的波前、相位和振幅,从而拥有波束转向、聚焦、偏振转换等等的强大能力。通过对声音信号或电磁波做精准的建模和优化,超表面能实现用普通的声波成像以及增加无线信号的通讯距离和速率。这些被动超表面低成本、无需供电、容易部署,是有效提升无线性能和功能的技术。
举个例子,超表面能为智能音箱带来“视觉”。智能音箱只有很少几个扬声器和麦克风,但可以通过超表面搜集物体发出不同方向的波,根据人在房间里的位置变化带来反射信号的变化不仅能定位人的位置,而且能感知距离的变化从而探测呼吸,也能在不侵犯隐私的情况下了解空间内的信息。
超声波成像很普遍,但超表面让技术实现的门槛显著下降,可以使智能音箱这样的设备成像。超声成像的优势之一是它能相对保护隐私,同时能透射。超声波带宽有几兆Hz, 还需有专业的带有几百个收发器的探头。而智能音箱只有几千Hz的带宽,2-4 个扬声器和麦克风。带宽和收发器都大大受限。“在类似普通智能音箱上做成像,我们是第一次达到这种效果。”邱锂力介绍。
邱锂力的团队不仅开发超表面来提高无线感知的精度,同时也结合了机器学习。无线信号传入时,通过信号处理,可以确定一些基本信息,比如信号的角度和距离,从而实现2D定位。但在实际应用中,由于信号强度可能不足,或者目标物体移动速度较快,通常的信号处理方法无法准确捕捉目标位置,就常会出现异常情况。这时,结合使用机器学习模型进行分析就显得尤为重要,这种结合信号处理和机器学习的方法,能更有效地解决问题。
机器学习对不同模态信号的分析可以应用在诸多系统的开发上,比如智能语音早筛系统。“语音是一个非常有用的信号,一方面它比视频能更好地保护隐私,同时它也包含了很多丰富的信息,包括人的生理健康信息,比如我们的发音反映了发音器官的健康程度,发音也能反映出头脑的健康程度还有情绪。所以,我们团队基于这些开发出了语音‘治疗师’用于高鼻音患者,也开发了阿尔茨海默症的早筛系统,相关项目我们正在与医院合作,希望能推动技术落地。此外,我们也正在探索通过语音来感知情绪。”她说。
邱锂力表示,团队也在探索通过视频做无监督的异常检测,比如自闭症患者有一些异常的刻板行为,“我们通过建模,抽取2D、3D的关键点信息,并利用刻板行为的一些特征,实现无监督异常行为监测”。
这些都是未来的应用方向之一。
大模型与无线通信的双向赋能
大模型的不断发展也在与无线通信双向赋能。
“AI能够提高数据的压缩率,许多内容可以在接收端直接生成,从而减少传输量,大大减轻网络压力。如果丢包,我们也能通过AI技术自动修复。使用AI技术传输数据,也促使微软去开发一些新技术,比如在边缘设备上运用AI,避免所有数据都上传到云端,这样既减少了传输需求,也更好地保护了隐私。像微软近期发布的Phi-3-mini就可以更好地保护隐私,不用传到云端。”她表示,这是大模型在无线通信数据传输时可以发挥的作用。
4月末,微软在官网推出了小语言模型(SLMs)——Phi-3-mini。作为微软Phi系列的第四代产品之一,Phi-3-mini有38亿参数和3.3T tokens的庞大训练数据量,有4k和128k tokens两个上下文长度变体,经过预训练和指令调整,可以更好地理解人类的语言、表达、逻辑并执行不同类型的指令。
“我们需要结合通信算法和应用需求,了解数据传输的具体需求,以便更好地进行数据压缩和复原,从而降低传输成本。每一个模态都有它自己的特性。”她说。
因此,如今的无线通信网络是一个包含了多种人工智能算法的复杂领域。
“AI技术影响着无线通信的各个层面,从物理层、网络层到应用层。在物理层,最基本的任务是解码无线信号,即确定传输的是1还是0。通常,这一任务依赖于信号处理技术,但在很多天线阵列的情况下,传统的信号处理方法并非最优。因此,采用AI技术可能会提高处理效果,目前许多公司正在推动这方面的发展。”邱锂力告诉第一财经,大模型在网络层出现异常时进行诊断和修复也有巨大的应用潜力,“因为这些模型拥有庞大的知识库,能够进行有效诊断。它们不一定需要依赖现成的案例,通过分析网络协议便可以预测可能的故障原因。”这使大模型可以在网络异常诊断时发挥作用。
在未来,随着AI技术的不断进步,可以预见的是大模型在无线通信领域的应用将越发广泛,而无线通信的发展也将为大模型的应用带来更多可能。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者宁佳彦
相关阅读 智源评测了100多个大模型:头部模型接近国际一流,但还存在“偏科”在中文语境下,国内头部语言模型的综合表现已接近国际一流水平,但仍存在着能力发展不均衡的情况。
昨天 20:22 探访数云原力大会:如何推动AI大模型应用落地?丨数字中国行当前,企业的AI变革面临价值、技术、路径等多个层面的复杂问题需要解决。
昨天 14:35 OpenAI重磅发布最新大模型 多模态能力有望融入更多应用场景北京时间5月14日凌晨,OpenAI发布最新多模态大模型“GPT-4o”,支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。
05-14 19:18 全面赶超GPT-4 ?阿里云发布通义千问2.5阿里云表示,与GPT-4相比,中文语境下,通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。
05-09 12:21 解码AI|“中国版Sora”诞生记 国产AI多模态赛道超车进行中比起大语言模型专业炒股配资门户,国内做视觉模型的起步较早,需要发挥国内产业链协同方面的优势。
04-28 18:13 一财最热 点击关闭