你不知道的长沙经济故事 | 4步“算”出一张文生图

(5月21日,国内首个基于国产算力预训练的视觉基座大模型——“橘洲”V1端侧版在长沙正式上线。)
星辰在线5月25日讯(星辰全媒体记者 贺亚玲)“两只大象在天空中飞。”随着一声令下,模型开始加载,不到15秒,相应的图画跃然于手机屏幕上。
近日,国内首个基于国产算力预训练的视觉基座大模型——“橘洲”V1端侧版在长沙正式上线,其在“断网”条件下上演惊艳首秀,以“轻量化、高精度、强隐私”的技术突破,让文生图片与千行百业的链接成为可能,以此,撕开了AI普惠化的新维度,也让全球人工智能战场“硝烟”正悄然从“云端霸权”转向“端侧自由”。
作为湖南省100个标志性数字新基建项目,“橘洲”由湖南汇视威智能科技有限公司(以下简称“汇视威”)依托中科曙光算力自主研发,是国内首个基于国产算力预训练的视觉基座大模型,能在智能手机上实现1024×1024分辨率图像的秒级生成,具有成本低、质量高、速度快、轻量级、可离线的特点。
打破云端依赖,开启千行百业智能新生态
继大语言模型之后,视觉大模型将是全球人工智能的下一个风口。
视觉大模型是视觉人工智能的基础设施,由于其参数多、模型大、算力需求强,其推理过程需在服务器端实现,因此有着推理成本高、数据隐私缺少保障、带宽和时延要求严苛等弊端。
“橘洲”视觉基座大模型创新性地解决了这些痛点。其采取跨模型结构极限蒸馏技术,图片解码模型参数量是云端解码模型参数量的1/50;设计了高效的文生图预训练方法,将训练时间压缩到20小时,速度提升5倍;使用加速推理训练方法,在保持出图质量不变的前提下,出图从28步压缩至4步,能做到秒级生成高分辨率图片;在安卓和IOS端均做到秒级生成图片,IOS端256像素可实现2.5秒出一张图;嵌入了独特的中国文化基因库,更符合国人使用需求。
“橘洲”还可以在飞行模式下,实现智能手机端1024×1024分辨率图像的秒级生成,也能满足在移动端上的部署和推理需求。在大大节省算力成本的同时,彻底打破创作场景的时空限制。
“对比国外主流开源模型,生成同样质量的图片,我们的体积和时间大约只有1/20。”顾善植表示,“橘洲”在实现数据隐私安全的基础上,在安卓和IOS端均能做到秒级生成图片,实现低成本移动端文生图,确保用户的个人创作不受时间空间限制,手机开飞行模式也可以“快速出图”。同时,“橘洲”还突破移动端生成高分辨率图像的能力,移动端文生图的效果可达到国内第一梯队。
“视觉、多模态大模型正迎来风口,但几乎都是在云端的推理方案,纯移动端侧较少。”顾善植表示,若将大模型部署于移动端,其计算成本非常微小,并且成本分散至用户自身承担,算力和运维方面都可“轻装上阵”。据悉,V1端侧版发布后,汇视威还将持续更新后续版本,冲击全球行业榜单。
青春力量破茧AI算力壁垒
成功从来不是一蹴而就,而是源于日复一日的努力和坚持。
(“橘洲”生成的第一张图片——一只知更鸟。以上图片均为 资料图)
2021年,汇视威在长沙注册成立。这群平均年龄不到30岁的“算力先锋”,经过上百次实验后,终于成功生成了第一张图片——一只知更鸟。“这对于汇视威团队来说是意义非凡的一张图片,代表这次实验的技术路线终于打通了。”汇视威创始人顾善植介绍。
目前,“橘洲”已依托中科曙光算力,在较短时间内完成了近4000万张图片训练,成为全国首个在国产算力上完成整体训练和推理过程,并实现移动端部署的视觉基座大模型。其构建的高质量图文数据集,融入独特的中国文化元素库,使生成图像更贴合国人审美与场景需求。
“我们还在攻关图片生成效果,希望质量更高,速度更快!”顾善植表示,256像素的图片,他的预期是0.5秒出图,512像素也要控制到1秒以内。
未来,汇视威将逐步拓展至文生视频、视频理解等领域,构建“端云协同”的智能生态。
双文驱动,政策赋能AI新势力
今年伊始,长沙就出台了《2025年全球研发中心城市建设工作要点》《关于支持长沙建设全球研发中心城市的若干措施》等重要文件,其中,人工智能更是长沙市“4433”现代化产业体系的重要组成部分,是前瞻布局未来产业、构筑发展优势的重要领域。
其中,《2025年全球研发中心城市建设工作要点》明确,将从引育具有全球竞争力的研发平台、壮大高新技术企业梯队、提升一城一区三基地集聚效应、推动科技创新和产业创新深度融合、优化高效能成果转化支撑体系、完善高层次科技人才矩阵、营造高品质科技创新开放环境、推进科技体制机制改革等八方面发力,并给每项重点任务都提出了具体举措和目标。
《关于支持长沙建设全球研发中心城市的若干措施》则在“强化核心技术攻关”一项任务中提出,支持科技领军企业整合产业链上下游资源,组建体系化、任务型的创新联合体,承接省十大技术攻关、重大科技攻关(含“揭榜挂帅”制)等省级科技重大项目。对企业研发中心在创新产品零部件、原材料、基础软件等方面自主研发取得重大突破、实现实际产出的重大项目,在省级科技项目中按政策给予倾斜支持。
作为长沙市“4433”现代化产业体系的重要组成部分,人工智能是前瞻布局未来产业、构筑发展优势的重要领域。从“具身智能”首现政府工作报告,到人形机器人在春晚惊艳出圈,再到以DeepSeek为代表的大语言模型的风靡,人工智能赋能之“风”已然吹向千行百业。
“橘洲”的发布让长沙在国产AI里实现了技术“上岸”,未来,长沙将借“橘洲”的星星之火,持续激发科技创新发展活力,推支撑更多创新型企业产现高质量发展,实现新质生产力的燎原之势。
【来源:星辰在线】


