本次演讲将深入探讨如何应对开源 AI 的复杂性,包括:采用 AI 专属许可协议如 OpenMDW、建设强大社区、推动厂商中立,以及采用 Model Context Protocol 和 Agent to Agent Protocol 等开放标准,降低集成壁垒,实现智能体协同。
Joaquín Salvachúa 是马德里理工大学的教授,任教于电信学院的电信系统工程系。他是 Gaia-X 西班牙枢纽、FIWARE 和 BDVA 董事会成员,同时也是 Gaia-X AISBL 的积极贡献者。他长期参与机器学习运维、大数据架构、云计算、下一代互联网技术、网络科学以及形式化方法等领域的研究,并发表了大量学术论文
演讲议题:一种数据空间定义语言(DSDL),用于实现数据空间之间的互操作性,并支持与自主智能体 AI 生态系统的集成
数据空间范式有望在数据经济参与方之间建立信任,但由于各类实现方案的碎片化,实际推进过程中面临诸多挑战。此外,从零开始构建数据空间本身也是一项复杂的任务。本次演讲将提出一种基于 PDDL 2.1 的数据空间定义语言,可用于定义每个数据空间中的工作流,并建立不同实现之间的互操作性模式。我们还开发了一个名为 Eunomia Agent 的数据空间代理,该代理能够理解并生成这种定义语言,并通过数据空间协议的双栈结构,实现与多种实现方式的互操作性。该代理提供了多通道协议的实现,使其能够几乎透明地与智能体 AI 进行交互,同时也支持基本的 A2A 协议。此外,这种语言还可用于定义数据服务(并生成具体实现),使其能够与 AI 智能体进行交互,成为其工作流中的组成部分。
超级智能 AI 系统的研发——即在多个认知领域全面超越人类能力的实体——已经不再是遥远的理论可能性,而是迅速逼近的技术前沿。随着我们加速迈向这一门槛,核心问题已不再是“我们是否会构建超级智能”,而是“我们将如何确保它的安全性、对齐性以及可被监督性”。
本次演讲将介绍“开放安全超级智能”(简称 OSSI)框架——这是一种旨在确保人类有史以来最强大系统服务于人类长期利益的研究与治理范式。我们在此呼吁科研与政策界汇聚于一个共同愿景:实现安全、可解释、并通过开放与集体远见进行治理的超级智能。OSSI 并非乌托邦式的理想,而是一个务实的、安全导向的蓝图,为的是构建一个我们能够生存并蓬勃发展的未来。
Salim Nahle 法国 EFREI 电子与计算机信息学院“数据与人工智能”项目经理兼高管教育学术主管
Salim Nahle 博士现任巴黎 Efrei 工程师学院的“数据与人工智能”项目经理兼高管教育学术主管。他于 2005 年获得黎巴嫩大学电信与计算机工程学位,2006 年在巴黎第六大学获得计算机科学硕士学位,2009 年在索邦大学获得计算机科学博士学位。其博士研究聚焦于基于 Wi-Fi 和 WiMAX 技术的无线网状网络,涵盖调度、路由及服务质量(QoS)等关键问题。2011 至 2014 年期间,他在 GE Healthcare 担任软件工程师,参与 “CT Revolution” 项目。2014 年至 2019 年,他担任 ECE 工程师学院网络安全与大数据系主任,期间创设了“大数据与分析”和“防御性网络安全”两个专业方向。如今,作为 Efrei 的项目负责人,他领导人工智能、数据与云计算领域的学术创新工作,同时为合作企业设计并实施持续教育与高管教育项目。
本次演讲将探讨生成式人工智能在教育领域中的作用,重点关注开源解决方案。内容涵盖部署 AI 工具时需考虑的关键因素,包括成本、基础设施以及部署过程中的挑战。演讲还将介绍 RAG 和基于智能体的系统,并结合实际案例,深入剖析在开放教育环境中所面临的具体问题与挑战。
通过列举人工智能技术在艺术领域的应用案例,分析人工智能艺术未来发展的可能性以及艺术家的责任。
演讲议题:基于 Hugging Face 实现开源模型的硬件无关加速方案
本次演讲将分享 Hugging Face 如何与 NVIDIA 之外的众多 AI 硬件合作伙伴紧密协作,通过 Optimum 库,让 Hugging Face 生态中的开源模型能够在不同的平台上流畅运行。从模型训练到部署,Optimum 帮助 AMD、Intel、AWS 等多种芯片实现灵活高效的性能。同时,本次演讲将介绍 Hugging Face 一路走来的经验与收获,以及如何让机器学习真正实现硬件无关性。
本次演讲将详细介绍 llama.cpp 在多模态支持方面的重要升级,通过集成 libmtmd 提升了稳定性并统一了接口。这一升级已于五月成功完成,目前已支持 Qwen VL、Mistral Small、Gemma 3 等模型,并推动了社区在视觉与音频应用方面的开发。
游凯超,清华大学博士,自 2024 年访问加州大学伯克利分校起,一直参与 vLLM 项目。他目前是 vLLM 项目的核心维护者之一,主要负责 vLLM 分布式推理架构设计、vLLM 与ile 的集成、开源社区合作及项目的其他多个方面。
vLLM 是一个快速且易于使用的大语言模型推理与服务库。在本次演讲将简要介绍 vLLM 项目的发展历程、其背后的开源社区,并重点分享一些用户广泛关注的功能特性。
Aurélien-Morgan CLAUDON,法国机器学习工程师,拥有 20 多年在自动化与数据驱动交付领域的实战经验,曾任 Capgemini 顾问,并具备大型企业、初创公司及自由职业背景。他毕业于 ESSEC 高等商学院的高管 MBA 项目,自 2017 年起活跃于机器学习领域,过去 5 年多专注于 MLOps,工作风格兼具工程实用主义与深度产品思维。他是开源框架 retrain-pipelines(Apache 2 许可证)的创始人,该框架从第一性原理出发,致力于解决 MLOps 领域长期以来缺乏用户中心化的问题。他的使命是为 ML 工程师提供实用、可扩展的工具,支持持续学习工作流的构建与落地。
持续学习对于生产环境中的自托管大语言模型至关重要,但大多数企业在实现自动化重训练方面面临困难。本次演讲将介绍一个简化的重训练框架,支持可插拔的领域适配器、LoRA 特化机制,以及具备高价值的基础设施特性。
刘广是智源研究院(BAAI)数据研究团队的技术负责人,主导 OpenSeek 项目。他也是 Aquila 大语言模型系列和 Infinity 数据集家族的主要架构师。目前研究重点是智能体数据系统,致力于为下一代 AI 训练创新合成数据生成方法。
OpenSeek 致力于联合全球开源社区,共同推动算法、数据与系统的协同发展,助力下一代模型的构建。在第一阶段,我们发布了 CCI4.0 数据集、OpenSeek-small 模型以及 OpenSeek-Pipeline 工具链;同时在 FlagScale 框架中开发了 DualPipe-V 并行训练策略,并携手 PAZHOU 大赛发起共创任务,以支持社区的广泛参与与贡献。
陈海泉,火山引擎开发者,verl 项目核心贡献者,专注于自主智能体强化学习与云基础设施领域。
verl 是字节跳动 Seed 团队开发的一款开源的 LLM 强化学习框架,适用于智能体任务,具备灵活扩展多种 RL 算法、无缝集成现有 LLM 基础设施、支持高效分布式计算和多场景应用等特点,且拥有活跃社区。
Richard REINER 是一名连续创业者与企业构建专家,目前以高管、投资人、导师与董事会成员的身份,积极活跃于网络安全、人工智能和物联网交叉领域的多家高成长企业,现任 CC Stratus Capital 创始合伙人。
如今的大语言模型和其他生成式 AI 应用,正在彻底改变我们的工作方式,帮助人类摆脱日常繁琐任务,专注于创造性和高价值的贡献。然而,这项卓越的能力也伴随着高昂的代价。本次演讲将分享如何通过 Procero 独特的动态优化技术,将大语言模型和生成式 AI 的强大能力从高成本、高耗能的云端服务器迁移至手机、笔记本电脑及物联网设备等边缘端,推动 AI 应用更高效、经济且环保地落地。
本次介绍将陈述 2025 年来智谱开源的模型,包括 GLM-4.5 系列,GLM-4.1V 系列,以及陈述智谱 AI 在模型开源上的工程与算法适配,社区合作模式。通过系统性阐述智谱 AI 开源模型的流程,让开发者熟悉大模型开源过程中的工程和算法难题,解决方案和工作方法。
Jinwei Gu 博士现任英伟达首席研究科学家,并兼任香港中文大学客座副教授。他的研究方向涵盖生成式人工智能、世界模型,以及计算机视觉、计算机图形学和机器学习等领域。他于 2010 年在哥伦比亚大学取得计算机科学博士学位,分别于 2002 年和 2005 年在清华大学获得学士和硕士学位。 在英伟达期间,他是 Cosmos 模型开发的技术负责人之一。Cosmos 是一系列多模态世界基础模型,致力于在机器人、自动驾驶和生成式人工智能等领域实现真实世界的应用。在加入英伟达之前,他曾在 SenseBrain 担任研发执行总监,主要负责基于新型图像传感器和成像系统的移动计算摄影技术研究。 Jinwei Gu 博士在计算机视觉领域顶级会议和期刊上发表了大量论文,并曾担任 IEEE Transactions on Pattern Analysis and Machine Intelligence 和 IEEE Transactions on Computational Imaging 副编辑(2018-2023),并多次担任 CVPR、NeurIPS、ICCV、ICCP 和 ECCV 等顶级会议的领域主席,以及多个学术研讨会(如 MIPI、RichMediaGAI)的组织主席。他于 2018 年成为 IEEE 高级会员。他的研究成果已成功应用于诸多产品,包括 NVIDIA-Cosmos、NVIDIA-CoPilot SDK、NVIDIA-DriveIX SDK,以及广泛应用于旗舰手机中的超分辨率、超级夜景、人像修复和 RGBW 成像解决方案等。
NVIDIA Cosmos 是一系列专为物理 AI 而设计的世界基础模型,主要包括三个核心组件:Cosmos-Predict、Cosmos-Transfer 和 Cosmos-Reason。本次演讲将全面介绍 Cosmos 模型的整体架构、发展历程、基准测试与评估方法,并着重讲解面向机器人与自动驾驶应用所开展的模型后训练工作。同时,我也将展示如何利用 Cosmos 世界基础模型高效完成合成数据生成、具身智能及其他下游任务。
Jian Shi,Kornia AI 的联合创始人,Kornia 库(PyTorch 中领先的计算机视觉框架)的核心维护者之一。他致力于通过开放协作来推动空间人工智能技术的发展和普及,目前是阿卜杜拉国王科技大学(KAUST)的博士候选人,研究方向为生成模型与立体视觉。
本次演讲将介绍一种突破性的计算机视觉方法,它结合了 Kornia 视觉库与大语言模型,构建出具备智能体特性的计算机视觉系统。我们将展示如何利用 MCP,将复杂的计算机视觉操作转化为自然语言交互,从而让用户无需深厚的编程基础,也能轻松实现先进的图像与视频处理功能。
1ms.ai 是一家致力于打造突破性人工智能开源项目的初创公司,其中一个项目是 DORA-RS,这是一种创新性的中间件,能够以领先的性能在 AI 模型、传感器与执行器之间共享数据。这使得跨模态构建复杂应用成为可能,也帮助我们实现了一些非常复杂的机器人演示项目。
演讲议题:利用 DORA-RS 混合多模态 AI 模型,解决复杂机器人任务
近年来,Transformer 模型在许多复杂的预测任务上实现了突破性的成果,使得一些曾经极具挑战的机器人任务变得触手可及。在本次演讲中,我们将重点介绍在机器人领域发挥关键作用的一些模型,以及这些模型目前存在的局限性。
王鹏伟,北京智源人工智能研究院具身智能大模型负责人、目前主要负责具身大脑大模型 RoboBrain 以及大小脑框架 RoboOS,研究方向是具身智能、多模态大模型、深度学习、自然语言处理和机器学习等方向,曾就职于阿里巴巴达摩院以及快手科技大模型中台部门,主要负责大规模语音语义一体化等多模态交互系统以及多模态预训练项目,具有丰富的多模态大模型、文本大模型以及机器智能等产学经验。
本次演讲将详细介绍智源研究院发布的首个跨本体具身大小脑协作框架 RoboOS 与开源具身大脑 RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持,为主流本体提供一站式大小脑部署流程,提供即插即用解决方案。
Edgar Riba 任职于 Bonsai Robotics,Kornia 项目的创始人兼项目负责人,负责引领 Agentic AI 与视觉-语言动作模型方面的研究,以及为教育和研究型机器人量身打造相关工具。他擅长将经典计算机视觉、深度学习与真实世界的机器人应用紧密结合,提供稳健、可扩展的自动化解决方案,专注于先进的计算机视觉与空间人工智能技术。
本次演讲将介绍下一代机器人平台——Amiga,这是一种专为农业和户外物流场景设计的模块化机器人平台。Amiga 旨在实现快速原型开发与实际部署,支持定制化的电动多功能车辆,以精简劳动密集型任务,降低成本,并促进有机再生农业的实践。
岑明于 2006 年在中国科学院研究生院获得光学工程博士学位。他现任重庆邮电大学教授。在职业生涯中,他曾任软件系统分析师,并担任汽车电子与嵌入式系统研究中心副主任。他的研究兴趣包括信息融合、多目标跟踪、自动驾驶和智能机器人。
地面自主平台在灾难救援、矿产开采、现场巡检和农业作业等领域的应用日益增多,其中定位与建图技术对这些平台至关重要。然而,在非结构化环境中,障碍物和不可通行区域呈现出多样化的类型和复杂的特征。现有的面向结构化场景的建图与路径规划方法难以有效应对这些挑战。因此,针对非结构化环境的地图生成与路径规划方法研究具有重要的学术价值。
在具身智能与人形机器人交汇发展的大背景下,以数据学习、模型训练为核心的机器人开发范式革命悄然展开。国家地方共建人形机器人创新中心推出“格物-致知”通用机器人开发平台,提供机器人从高层算法模型训练、任务流编排到底层具身硬件配置的全流程开发能力,搭配国地中心全开源 OpenLoong 控制框架,一站完成异构本体适配、计算架构适配、仿真实机适配,加速具身智能场景应用落地。
夏轩,博士毕业于上海交通大学,现任深圳市人工智能与机器人研究院副研究员。他是国家自然科学基金项目负责人,2024 年吴文俊人工智能科学技术进步奖获得者,深圳市高层次人才及深圳市龙岗区高层次人才。其主要研究方向包括具身智能、多模态学习、计算机视觉、缺陷检测及生成模型等领域。他主持了国家自然科学基金、广东省自然科学基金、中国博士后科学基金等多个科研项目,并参与多项国家、省市级基金项目及企业合作项目。已出版专著一部,发表论文二十余篇,申请发明专利十余项。
本次演讲将介绍 AIRSPEED 这一通用数据生产平台,整合上下游资源,满足从基础软硬件开发商到具身智能应用商的全方位数据需求。AIRSPEED 平台在技术架构与功能设计上展现出卓越的创新性与前瞻性。其采用 ROS 2 架构,确保分布式灵活部署,通过通用软件接口实现设备快速调通,兼容多种遥操作设备、机器人本体以及末端执行器,无论是 VR 遥操作、手柄遥操作,还是外骨骼控制,都能无缝衔接,实现对任意机器人形态的适配控制。在数据生成方面,AIRSPEED 支持预测生成、轨迹合成、资产合成等多种功能,可依据用户需求生成任意操作轨迹、可交互资产以及智能体决策,为具身智能模型训练与算法优化提供丰富、高质量的数据资源。
岑汝平,博士,现任职于重庆邮电大学自动化学院。他的研究方向主要包括移动机器人定位与导航、多传感器融合定位技术。基于深厚的学术积累,他创建了开源项目 MickRobot,从零开始打造了一套涵盖机械设计、硬件集成、感知与定位,以及导航控制系统的双臂仿人机器人平台。除了代码贡献之外,他还撰写了一系列技术博客与教程,记录了该项目的开发历程,累计页面浏览量超过 110 万次,在社区中产生了广泛的影响力。
本次演讲将介绍 DORA-RS 框架的内在优势,以及它在多个具身机器人平台上的具体应用,并以基于 DORA-RS 的抓取与分拣系统作为实例进行说明。
李涛,深开鸿软件工程师,目前担任 OpenHarmony 开源机器人系统项目的主要开发者。
本研究将主要介绍深开鸿联合产业界与学术界共同研发的一款基于 OpenHarmony 的开源、全场景、智能化机器人全栈操作系统。该系统面向教育、工业自动化、巡检、服务机器人等多种机器人应用场景。与传统基于 Ubuntu 系统和 ROS 中间件的方案相比,我们的方案以 OpenHarmony 为基础系统,并结合 Dora 机器人中间件,在安全性、可控性、可信性、云边端协同以及应用开发语言范式等方面具备显著优势。此外,该架构有助于构建开放生态,促进开源共创,加速商业化落地。
常高伟是 ANP 开源社区发起人,该协议是全球最早的智能体通信协议,ANP 的目标是成为智能体互联网时代的 HTTP,ANP 的愿景是定义智能体之间的连接方式,为数十亿智能体构建一个开放、安全、高效的协作网络。
随着大模型技术的发展,智能体正逐步成为互联网的核心参与者。本次演讲梳理了从语义网到 Agentic Web 的技术演进,提出构建标准化智能体网络协议的紧迫性与必要性。总结出 Agentic Web 的四大关键趋势:智能体替代传统软件、实现普遍互联、以协议为核心连接方式,以及具备自主协作能力。同时,指出当前互联网在接口、协作和数据孤岛等方面对智能体发展构成阻碍。为解决上述挑战,提出了智能体网络协议的设计原则与功能需求,并比较分析了 MCP、A2A、ACP 与 ANP 等主流协议。呼吁全球开发者与标准化组织共同推动智能体协议标准的制定,构建开放、高效、可信的 Agentic Web。
随着人工智能越来越多地在分布式、动态化的环境中运作,对于强大、可验证且可互操作的身份基础设施的需求变得至关重要。本次演讲将介绍一种专为数据空间设计的身份验证协议,该协议Kaiyun体育官方网站 开云登录网站与欧盟对于安全数字生态系统的愿景相一致。通过结合授权协商与授权协议和支持可验证展示的开放身份连接协议,以及支持关联可验证展示,该解决方案实现了一种安全且保护隐私的身份框架,支持以人为中心及完全自主的智能体交互。
该方案基于自主身份的原则,去中心化身份控制,降低对信任的假设,并创建机器可读的身份声明。本次演讲将探讨这种基础设施如何赋能 AI 智能体,使其能够在受监管的环境中安全运行,并与欧盟《数据法案》和《人工智能法案》的规定保持一致。此外,我们还将深入探讨 GNAP4VP 协议在技术设计、交互流程和现实世界中的适用性,展示其如何在身份层面实现信任与自主,从而为智能系统之间实现可扩展、可验证且自动化的交互奠定基础。
张云飞,中国电信智慧城市研究院副院长,中国电信首席专家,教授级高级工程师,国家级人才计划特聘专家,交通运输部中青年领军人才、国际公路交通科技领军人才,5G 产业方阵副理事长,中国通信标准化协会物联网委员会副主席,曾任腾讯未来网络实验室主任,腾讯智慧交通首席科学家。提出泛 V2X 技术体系和实践,在业界形成广泛影响。在 IETF 创立 P2P 流媒体协议工作组并担任主席,在 IETF、ITU-T 等发布 10 多个国际标准。获得中华杰出工程师青年奖、国家专利银奖、国家标准奖、上海市技术发明一等奖、上海市科技进步奖一等奖、深圳市科技进步一等奖、金桥奖个人奖、中国车联网杰出人物奖、IEEE ITSC 智慧交通和车路协同双冠军等省部级以上奖励 20 多项。
随着 AI 技术迈入新纪元,传统数字化架构的局限性日益凸显。本次演讲将介绍革命性的 RVP 协议,这是面向后数字时代设计的全新 AI 生态系统架构。演讲将深入解析 RVP 协议的三大核心:现实层的多源数据融合、虚拟化层的数字孪生技术、以及感知层的多模态 AI 能力整合。重点阐述该协议如何突破现有技术瓶颈,实现跨域协同、自适应进化的智能网络。通过智慧城市、自动驾驶、工业互联网等实际应用案例,展示 RVP 协议在解决数据孤岛、算力分散、模型割裂等关键问题上的独特优势。演讲还将探讨该协议的标准化路径与产业化前景。 作为下一代 AI 基础设施的技术蓝图,RVP 协议代表着从工具化 AI 向生态化 AI 的根本转变。本演讲将为与会者提供前瞻性的技术洞察,共同探索人工智能的未来发展方向,推动产业数字化转型的深度变革。
Ruoyu Ying 是英特尔 STG 部门的云软件工程师。她曾在多个开源社区从事 ONAP、网络、服务网格和机密计算等领域的工作。目前,她的主要关注领域之一是基于云原生基础设施的生成式人工智能技术赋能。此外,她还参与撰写了关于边缘计算的白皮书和书籍,并曾在 OpenInfra 和 KubeCon 等峰会上成功发表多次演讲。
随着生成式 AI 在各个行业快速兴起,企业迫切希望借助它来提升生产力和用户体验。然而,将 AI 引入实际生产环境仍面临诸多挑战——尤其是在资源有限、预算紧张以及与现有企业系统整合复杂的背景下。如今摆在企业面前的关键问题是:如何以更快的速度、更低的成本、更少的干扰部署 AI,甚至还能充分利用现有的基础设施? 本次演讲将介绍我们推出的开源企业级 AI 平台 OPEA,该平台能够帮助企业快速构建、部署和验证适合自身需求的 AI 应用。我们将逐步讲解项目的核心架构、模块化设计和云原生部署模式,展示其如何简化企业在真实生产环境中的 AI 整合。此外,我们还会深入探讨 OPEA 如何与 InfiniEdge AI 的 SPEAR 项目集成,支持在云、边缘及设备之间按需进行智能体编排和跨领域协作。最后,我们将通过一个实际案例演示如何结合这些技术实现一个实时语音助手,充分展现该平台对企业 AI 转型的实际价值和影响力。
董鑫,华为中央软件院项目群总监,从事研发工具链,编程语言,IDE 等核心基础软件研发工作。在华为公司工作期间,先后作为首席技术专家和项目经理从事华为移动端 AI 研发工具,公司级 AI 研发平台,华为昇腾 AI 芯片工具链,鸿蒙 OS 工具链等相关工作。 2021 年起负责华为编程语言和 IDE 基础软件的研发业务,并担任项目群总监,从事自主可控的编程语言及 IDE 开发工具的核心技术研发工作,对国产应用编程语言的技术规划,产品化,产业落地进展等工作出了重要的贡献。
本次演讲将整体介绍仓颉编程语言以及基于仓颉编程语言的 AI 大模型开发框架 CangjieMagic,该框架支持向 Agent 编程,为开发者提供高效 Agent 编程的 Agent DSL,支持 MCP 协议方便 Agent 和工具相互调用,支持模块化调用,支持任务智能规划。提升开发者开发智慧鸿蒙应用效率,打造极致开发体验,探索未来大模型应用开发新范式。
Zhiyu Li 博士是 MemTensor(上海)科技有限公司的联合创始人兼首席技术官、IAAR 研究员、上海交通大学人工智能学院(SAI)产业青年科学家。他的研究聚焦于大语言模型与生成式人工智能,尤其专注于“记忆增强智能”与 GAI 基础设施的构建。
在此之前,李博士曾领导阿里巴巴和小红书的核心 AI 团队,推动了多项算法创新,创造了数十亿级的商业收益。在 MemTensor,他主导研发了全球首个面向大语言模型的“记忆操作系统”(MemOS)。
当前的大模型系统虽具备强大的生成与推理能力,但长期以来缺乏“记忆”的支撑,导致知识无法持续积累、上下文难以长期保持,幻觉和逻辑断裂频繁发生。MemOS 是面向大模型的首个工业级记忆操作系统,旨在为智能系统提供统一的记忆管理底座。 本次演讲将围绕“智能始于记忆”的核心理念,介绍 MemOS 的系统架构与开源进展,分享如何通过动态知识注入、分层记忆调度和跨模型记忆迁移,建立面向大模型的新一代记忆管理范式。演讲将结合行业应用场景的实际案例,探讨如何用 MemOS 推动大模型更低成本、更高效、更可信地落地行业场景,迈向长期智能与可持续演化。
白婷,北京邮电大学计算机学院副教授,专注于个性化推荐、大模型研究及应用,以第一或者通讯作者发表高水平学术论文 40 余篇,包括 4 篇最佳论文/最佳论文候选奖,相关研究成果应用于腾讯、小米等头部互联网公司。获得 2020 年中国中文信息学会优秀博士学位论文奖,2023 年中国电子学会科技进步一等奖,2023 年百度首届全球 AI 华人女性青年学者, 2024 年中国科协青年托举人才。
构建个性化智能体服务时,需适配垂域特性、保障交互个性化及内容可信合规。但传统通用智能体存在明显短板:难以精准贴合垂域知识体系,长交互中记忆易断裂,内容生成追溯困难。本次演讲将介绍 “垂域适配 - 记忆管理 - 可信生成” 的个性化体系。核心模块 MemoryOS 作为首个开源记忆操作系统框架,深度融入知识与记忆管理环节,通过关联垂域知识图谱实现精准检索,可有效解决垂域智能体知识检索不精准、交互连贯性不足及个性化欠缺等问题。通过多模块协同,在确保内容可追溯、合规的基础上,借助优化记忆与知识管理,为垂域个性化 AI 应用提供了一套完整可复用的技术实践路径。
刘南兵,饺子互动科技联合创始人,5ire.app 作者,中文写作社区 发起人。
本次演讲将介绍 5ire,从一个简单想法出发,逐步走向开源、获得社区反馈并持续演进的过程。我们将回顾从产品设计、技术选型到快速构建 MVP 的关键节点,分享过程中遇到的问题与转折,以及我们如何重新理解 AI 应用的价值定位,找到与大模型能力的互补点。希望这段经历能为正在构思、验证或打磨产品的开发者,提供一些参考和启发。
Florian 在人工智能领域拥有 10 年的丰富经验,曾就职于 Axel-Springer、德勤(Deloitte)和 SoundCloud 等公司。目前,他担任 Jina AI 的首席工程师,致力于快速构建人工智能原型解决方案。他的专业领域包括智能体搜索和合成数据生成。同时,Florian 还担任人工智能政策顾问,向欧洲议会成员提供相关讲解与见解,帮助他们更深入地理解人工智能。
较长的文本会人为抬高余弦相似度;CISI 演示揭示了这一偏差,并展示了如何通过非对称编码与混合重排序的方法加以修正。
Wilson Wang,字节跳动全球边缘团队软件工程师,专注于虚拟机和 WebAssembly 技术。我对操作系统、分布式系统、云原生技术、边缘计算以及无服务器架构领域有着浓厚的兴趣。
演讲议题:SPEAR - 一个可扩展的、分布式的边缘与云端 AI 智能体框架
SPEAR 是 LF Edge InfiniEdge AI 项目下的下一代开源框架,专为灵活、可扩展的 AI 智能体工作负载而设计。SPEAR 支持在多种运行时环境下执行,目前已支持本地进程和 Docker 容器,并计划未来支持 WebAssembly 和 Kubernetes。SPEAR 赋能开发者构建具备可定制能力和面向未来扩展性的智能体,广泛适用于边缘为中心的应用场景。
刘世伟博士是牛津大学的英国皇家学会牛顿国际研究员,曾任美国德克萨斯大学奥斯汀分校博士后研究员。他于 2022 年以优异成绩获得荷兰埃因霍芬理工大学博士学位。他的研究目标是利用、理解并拓展神经网络中低维结构的作用,以实现可扩展且高效的人工智能。刘博士曾获得沙特阿卜杜拉国王科技大学(KAUST)和“简约性与学习大会”(CPAL)颁发的两项新星奖,其博士论文荣获 Informatics Europe 颁发的 2023 年度最佳博士论文奖。
大语言模型已展现出令人瞩目的成果。然而,最新研究表明,它们的深层通常贡献较小,且随着层数加深,模型效果呈现出逐渐减弱的趋势。这一现象为模型压缩提供了重要机会。本次研讨会的第一部分将探讨如何利用这一特性,实现高效的大模型推理。尽管存在压缩潜力,深层利用不足仍导致显著的资源浪费,这些资源本可以用于进一步提升模型性能。研讨会的第二部分将聚焦于深层失效的根本原因,并提出相应的解决方案。我们发现问题源于当前广泛采用的“预层归一化”机制。为此,我们引入了一种新方法:LayerNorm Scaling(LNS),用于解决这一结构性问题。实验结果表明,LNS 能够使深层生成更具多样性的表示,从而更有效地发挥其作用,显著提升预训练模型的整体质量,并增强其在下游任务中的适应能力。
张拳石,上海交通大学电院计算机科学与工程系长聘副教授,博士生导师,入选国家级海外高层次人才引进计划,获 ACM China 新星奖。他于 2014 年获得日本东京大学博士学位,于 2014-2018 年在加州大学洛杉矶分校(UCLA)从事博士后研究。张拳石在神经网络可解释性方向取得了多项具有国际影响力的创新性成果。张拳石承担了 TMLR 的责任编辑,CCF-A 类会议 NeurIPS 2024 的领域主席,IJCAI 2020 和 IJCAI 2021 的可解释性方向的 Tutorial,并先后担任了 AAAI 2019, CVPR 2019, ICML 2021 大会可解释性方向的分论坛主席。
演讲议题:神经网络是否可以被严谨地解释清楚?Scaling Law 是否会成为大模型永远的桎梏
“模型可解释性的不足”和“Scaling Law 的桎梏”是深度学习领域中两大瓶颈性问题,但是从内在机理层面却殊途同归地指向同一根因——对模型表征能力缺少根本性解释与建模。目前大部分可解释性研究依然停留在工程技术层面,无法在机理层面直接解释模型表征能力。张拳石团队所提出的基于等效交互可解释性理论体系,从机理层面部分解决了上述问题,证明了神经网络内在复杂表征逻辑可以被严谨且全面地概括为稀疏的交互概念,并基于交互概念可以充分解释神经网络的性能根因,从而跳出黑盒训练范式,有针对性地实时监控并修复模型表征缺陷,提升训练和测试效率,摆脱 Scaling Law 的桎梏。
本次演讲将分享 AI 绘画当下的局限,它和人的思考根本差异是什么,以及未来会有哪些方向。
GOSIM 的 Workshop 动手工作坊一直以“多元、实操、互动”著称,成为大会中最受欢迎的版块之一。每一场 Workshop 都将由领域专家带领,融合理论讲解与实操环节,鼓励参与者主动提问、即时练习,甚至在现场协作解决实际问题。
本次 Workshop 将带你从零开始,使用 Rust 构建一个安全、高效的嵌入式 AI 系统。你将亲手把 ESP32 硬件变成一个可语音对话的智能机器人,深入理解 Rust 在嵌入式场景中的独特优势。
尤其适合对嵌入式开发、物联网、语音交互、边缘推理或智能体应用场景有兴趣的开发者与创客参与。为确保顺利参与,请准备一台具备一定算力的电脑、Type-C 数据线,并熟悉 Rust 基本操作。我们也将为报名者提供完整开发套件(包括 ESP32 开发板、音频解码器、麦克风、WiFi 模块),欢迎自带设备参与实践体验。
9 月的杭州,西子湖畔,我们等你共赴一场关于“开源、协作与未来”的技术盛会!保存下图,扫码进入官网,欢迎提交演讲申请、赞助支持以及参会购票即刻加入 GOSIM HANGZHOU 2025!