中国电信股份有限公司上海分公司,上海 201203
章伟(1982- ),男,中国电信上海公司工程师,云中台/数字集成部副总经理,主要从事大视频和人工智能等领域顶层设计工作。
张驰(1990- ),男,中国电信上海公司工程师,云中台/数字集成部系统架构师,主要从事大视频和人工智能等相关架构设计和研发工作。
沈阳(1995- ),男,中国电信上海公司云中台/数字集成部软件开发工程师,主要从事大视频和人工智能等相关技术研发工作。
收稿:2024-11-29,
修回:2025-02-26,
纸质出版:2025-03-25
移动端阅览
章伟,张驰,沈阳.视联网大模型在城市治理场景中的应用[J].电信科学,2025,41(Z1):294-298.
章伟,张驰,沈阳.视联网大模型在城市治理场景中的应用[J].电信科学,2025,41(Z1):294-298. DOI: 10.11959/j.issn.1000-0801.2025095.
随着视频监控技术和人工智能技术发展,依托视频流和人工智能算法的城市治理应用已成为了智慧城市建设当中的重要一环。然而城市治理里面长尾场景众多,传统人工智能算法效果不佳,研发成本也非常高,制约了城市治理数字化、智慧化的发展。多模态大模型作为一种整合多种模态信息的大模型技术,和传统小模型相比有着信息更全面、泛化性能更强的优点,在城市治理长尾场景中相较于传统人工智能技术有更好的表现。因此,提出了一种在城市治理长尾场景中基于多模态大模型实现算法研发和落地的方法,在实验中相较于传统视觉人工智能技术在功能和性能指标上有显著的提升。
VASWANI A , SHAZEER N , PARMAR N , et al . Attention is all you need [J ] . Advances in Neural Information Processing Systems , 2017 ( 30 ): 5998 - 6008 .
CAI W , JIANG J , WANG F , et al . A survey on mixture of experts [J ] . arXiv preprint , arXiv: 2407.06204 , 2024 .
郭全中 , 杨元昭 . 大模型发展回顾与展望 [J ] . 中国传媒科技 , 2024 ( 2 ): 159 - 160 .
LI C Y , GAN Z , YANG Z Y , et al . Multimodal foundation models: from specialists to general-purpose assistants [J ] . Foundations and Trends® in Computer Graphics and Vision , 2024 , 16 ( 1-2 ): 1 - 214 .
KRIZHEVSKY A , SUTSKEVER I , HINTON G E . ImageNet classification with deep convolutional neural networks [J ] . Communications of the ACM , 2017 , 60 ( 6 ): 84 - 90 .
HINTON G , VINYALS O , DEAN J . Distilling the knowledge in a neural network [J ] . arXiv preprint , arXiv: 1503.02531 , 2015 .
OQUAB M , DARCET T , MOUTAKANNI T , et al . DINOv2: learning robust visual features without supervision [J ] . arXiv preprint , arXiv: 2304.07193 , 2023 .
Glenn Jocher . Yolov5 [EB ] . 2025 .
0
浏览量
13
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621