03年,英伟达科学家团队将GPT-4接入Minecraft(「我的世界」)游戏,提出了全新的AI智能体Voyager。随着GPT-4不停歇地探索世界,Voyager逐渐掌握了挖掘、盖房、打猎等生存技能,同时扩充自身物品和装备,并在没有人为干预的情况下持续获得新发现。例如,如果发现自己是处于沙漠而非森林中的环境,智能体就会知道学会收集沙子和仙人掌,比学会收集铁矿更重要。
“由此展开,我们希望有个AI,通过给他设置改良、优化城市的任务,它便会根据当前的技术水平和城市状态提出适当的任务,相当于做城市体检和城市规划。”腾讯研究院资深专家、教授级高级城市规划师王鹏如是畅想AI在城市甚至是人居环境的应用场景。
王鹏认为,“城市大模型”需要基于环境反馈来完善策略,将掌握的策略与反馈记入记忆,并在类似情况下重复使用,相当于落地实施,还需要在实施过程中不断深化对城市的认知,动态地修正规划和策略;因为城市的改良,没有最好,只有更好,所以它需要持续探索城市——以自我驱动的方式寻找新的任务。
在腾讯研究院发布的《生成式AI人居领域应用趋势调研报告》中,有资深城市规划专家认为,在AI发展的早期阶段,基于规则的定量建模和专家系统,对城市规划起着关键的作用。虽然深度学习的出现带来新的可能,但它仍然与这些传统方法紧密相连。然而,并非所有任务都需要大型模型,对于特定领域而言,小型模型与本地知识库的结合可能更有效。AI在城市应用的目标,是提供针对各种场景的适当解决方案,并继续探索如何有效地结合各种工具和技术,以实现高效、经济的智能服务。
有没有可能建立一个城市大模型?城市大模型能做些什么?技术驱动将为城市治理带来什么变化?又将可能产生什么问题?基于以上问题,36氪与王鹏进行一场深入讨论。
城市大模型挑战:超越文本数据的复杂处理需求03年,随着通用大模型的快速发展,全世界看到了AI技术在城市治理中的潜力。王鹏认为,尽管现有的通用大模型在特定行业中应用仍有限,但它们在处理复杂系统问题上展现出了前所未有的能力。
因此,考虑发展更专业的行业大模型,如城市大模型,以支持更精细的城市管理和规划决策。这种模型可以帮助解决城市的各种问题,提升治理效率,再通过高质量数据和精调,实现真正的智能城市管理。
从具体研发角度看,截至目前,除了如生物基因蛋白质分子结构、时序时空这些特殊模态的大模型外,从零构建行业大模型没有必要,主要挑战在于算力成本。
官方数据指出,GPT-3数据集的体量为GB,LLaMA4的为88.GB。以GB的数据模型为例,这相当于需要处理超过亿份城市总规说明书规模的文本数据,每一份说明书的字数大概是十万字。这一巨大的数据量,侧面反映了行业大模型构建时所面临的高算力成本和技术门槛。
在城市领域,一些关键的行业知识,如规划文本、政策文件、和法规规范是难以完全通过文字表达的,这些知识的复杂性超出了简单文字的范围。此外,城市领域还涉及需要通过图纸等多模态数据处理的内容,这类信息更是无法简单地转化为可直接计算的格式。因此,建立城市大模型需要处理的不仅仅是文字数据,还要涵盖多种格式和类型的复杂信息。
在训练方面,达到所谓的“智能涌现”,仍然是一个未知数。一般而言,GPT3.5、文心一言、通义千问、GLM达到“智能涌现”,背后支撑的参数规模为千亿以上。这种智能涌现是处理复杂城市系统时,极为重要的能力。
然而,大多数行业大模型的参数规模通常只有百亿级别,为了保证调优的效果、效率和性价比,这样的规模是必要的。因此,这些模型虽然名为“大模型”,但在真正的智能表现上,可能只能达到形似而非神似,难以满足通用人工智能的高级预期。
截至目前,出于经济性的考虑,使用LLM模型应用,仍难以构建商业闭环,除了需求方对技术的理解参差不齐,成本也是一个无法绕过的难题。在一落地的城市相关大模型项目中,仅30MB的文本数据,在百亿参数模型上训练一次的成本就接近万元,且训练效果不可预知,但该成本在未来下降的可能性较大。
相比研发出一个行业通用大模型,基于基础大模型的能力,进行应用开发,将成为行业大模型的“主流形态”。
不同于以往的通用大模型,城市大模型通过精准的行业数据训练,致力于解决复杂的城市问题,如公共服务优化、城市规划和治理效能提升。这个应用,
转载请注明:http://www.0431gb208.com/sjslczl/7884.html