2023 Google 开发者大会:将大型语言模型部署到你的手机

2023-09-18 17:32:16

在2022年末,不到半年时间,各家大语言模型的发展如雨后春笋,截至2023年9月,全球总共有接近100个大语言模型,可谓是百花齐放
在这里插入图片描述
显而易见,大语言模型凭借出色的AI对话能力,已经逐渐深入各个行业

2023 Google 开发者大会带来了 AI 专题,Google 技术推广工程师魏巍提出“将大语言模型部署到个人终端” ,关于这点,在外行看来可能只会觉得无非就是手机多了一个功能,但在开发者看来,这就相当于把一头牛装进一个冰箱

这里面涉及到的挑战大概有以下几点:

  1. 模型压缩和优化:大语言模型通常具有巨大的参数量和计算需求,无法直接在手机上运行。因此,首先需要对模型进行压缩和优化,以减小模型的大小和计算量。这可以包括剪枝、量化、低秩分解等技术,以及其他针对特定模型的优化方法。
  2. 移动端推理引擎:为了在手机上运行大语言模型,需要使用高效的移动端推理引擎。这些引擎通常针对移动设备的硬件和资源进行了优化,可以提供快速而有效的模型推理能力。一些流行的移动端推理引擎包括TensorFlow Lite、Core ML和NCNN等。
  3. 模型量化:由于移动设备的计算资源有限,为了提高模型在手机上的性能和效率,还可以对模型进行量化。模型量化是指将模型的权重和激活值转换为较低精度的表示形式,如8位整数或浮点数。这样可以减少模型的内存占用和计算需求,同时保持相对较高的准确性。
  4. 硬件加速:一些新一代的移动设备配备了专门的神经网络处理单元(NPU)或图形处理单元(GPU),可以提供更高的计算性能和效率。利用这些硬件加速器,可以进一步加快大语言模型在手机上的推理速度。
  5. 离线部署和云端支持:为了实现在手机上离线运行大语言模型,需要将压缩和优化后的模型部署到手机中。同时,还可以结合云端技术,通过与云服务器进行通信,在需要时获取模型的更新和支持。

当然,Google技术推广工程师在会上也提到了这点
“大语言模型占用的存储空间非常大,部署到终端设备的机器学习(ODML)难度很大,但运行较小规模的模型是可行的”
在这里插入图片描述
作为本次大会的核心内容,谷歌还发布了第二代大语言模型PaLM 2(Pathway Language Model),这是一个基于深度学习的自然语言处理系统,可以处理多种基于文本的任务,如推理、编码、翻译、生成等。PaLM 2具有极强的逻辑和推理能力,支持100多种语言,可以用于多种场景和领域。

会上还提到Google Cloud 的重点更新,谷歌在云平台中深度集成了AI,帮助出海企业及开发者轻松借力 AI 推动和实现创新

在这里插入图片描述

AI 是 Google Cloud 工作的核心。AI 产品和模型是 Google Cloud 第一个 AI 重点发展领域,帮助出海企业及开发者轻松构建和部署生成式 AI 行业应用,保障企业级的安全与隐私。Google Cloud 让企业可以轻松借力 AI 推动和实现大刀阔斧的创新。


Google已推出多个场景的大语言模型,从文本聊天,到图片、代码、语音和 Embeddings 嵌入,一应俱全
在这里插入图片描述

● 文本模型
在文本模型的新版本中,模型的输入长度限制从 8,000 个 token 增加到 32,000 个。这使得开发者能够轻松处理更长的文档,例如学术论文、法律文书、图书等等。PaLM 2 现在正式支持 38 种语言,包括中文、日语、德语、西班牙语等等。另外还有 100 种语言处于封闭式预览版阶段。
在这里插入图片描述
● 文本转代码模型 Codey
在新版本中,对于所支持的主流语言,代码生成和代码聊天的质量提升了将近 25%。

● 图片模型 Imagen
在已经拥有图片生成、编辑、标注和视觉问答等功能的基础上,增加了 “样式调整” 功能,让开发者只需要提供 10 张左右参考图片,就可以生成符合品牌特征或其他创意需求的图片。

以上这些内容,感兴趣的朋友可以在CSDN专题页观看相关专题回放视频,除了 AI 开发领域,还有 Mobile 开发、Web 开发、Cloud 开发领域的精彩内容等你探索。
https://marketing.csdn.net/p/8b1b4b3f5f0fe4c3cdf1c2d5e42a05c3

更多推荐

OceanMind海睿思入选弯弓研究院《2023中国营销技术生态图谱8.0》

近日,由国内MarTech领域知名机构弯弓研究院主办的第五届营销数字化大会暨营销科技MarTech交易展在广州成功召开。本次大会发布了《2023中国营销技术生态图谱8.0版》(以下简称“弯弓图谱8.0”),中新赛克海睿思凭借成熟的技术实力成功入选弯弓图谱8.0的中台板块,成为数据与分析领域本土优秀代表服务商之一。随着企

Linux 共享内存

#include<sys/ipc.h>#include<sys/shm.h>intshmget(key_tkey,size_tsize,intshmflg);功能:创建一个新的内存段或者获得一个既有的共享内存段的标识。新创建的内存段中的数据都会被初始化为0参数:-key:key_t类型是一个整型,通过这个创建或者找到一

Linux查看程序和动态库依赖的动态库

一.前言在一些时候,我们需要知道一个程序或者动态库所依赖的动态库有哪些。比如,当我们运行一个程序的时候,发现可能会报错,提示找不到某个符号,这时我们就需要知道程序依赖了什么库,从而添加对应需要的动态库。等等,接下来介绍两种方法查看程序和动态库所依赖的动态库。二.方法介绍1.使用objdump命令objdump-pFIL

Toaster - Android 吐司框架,专治 Toast 各种疑难杂症

官网https://github.com/getActivity/Toaster这可能是性能优、使用简单,支持自定义,不需要通知栏权限的吐司想了解实现原理的可以点击此链接查看:Toaster源码集成步骤如果你的项目Gradle配置是在7.0以下,需要在build.gradle文件中加入allprojects{repos

(总目录)springboot - 实现zip文件上传并对zip文件解压, 包含上传oss

全文目录,一步到位1.本文概述1.1本文简介2.功能实现2.1统一文件校验2.2普通(多)文件上传[服务器]2.2.1controller层2.2.2service层2.2.3业务impl实现类2.2.4FileIOUtils工具包代码2.3zip文件的解压2.4图片文件的压缩2.5oss文件后端上传2.6oss文件前

九、【漏洞复现】Struts 2 远程代码执行漏洞s2-046(CVE-2017-5638)

九、【漏洞复现】Struts2远程代码执行漏洞s2-046(CVE-2017-5638)9.1、漏洞原理Struts2是一个基于MVC设计模式的Web应用框架,本质上相当于一个Servlet,在MVC设计模式中,Struts2作为控制器来建立模型与视图进行数据交互。攻击者通过发送恶意构造的HTTP数据包利用该漏洞(通过

vue 把echarts封装成一个方法 并且从后端读取数据 +转换数据格式 =动态echarts 联动echarts表

1.把echarts在methods封装成一个方法mounted在中调用折线图和柱状图mounted调用下边两个方法mounted(){//最早获取DOM元素的生命周期函数挂载完毕console.log('mounted-id',document.getElementById('charts'))this.line()

Comparator 接口使用方法,结合java8新特性及源码分析

目录1Comparator介绍1.1函数式声明1.2简单的小案例2.Comparator中的方法2.1compare抽象方法例子2.2comparing方法源码参考解释详细解释<?superT,?extendsU>讲解comparing代码样例例子comparing中的方法源码分析<T,UextendsComparab

安防视频/视频汇聚平台EasyCVR使用onvif探测添加设备通道详细步骤来啦!

视频云存储/安防监控EasyCVR视频汇聚平台基于云边端智能协同,支持海量视频的轻量化接入与汇聚、转码与处理、全网智能分发、视频集中存储等。音视频流媒体视频平台EasyCVR拓展性强,视频能力丰富,具体可实现视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、H.2

Nginx

概念nginx什么是nginxnginx是一个高性能的HTTP和正、反向代理的服务器nginx可以干什么可以作为web服务器,可以实现反向代理,可以实现基于反向代理的负载均衡,可以作为静态资源服务器(类似于七牛云)什么时候使用nginx后台搭建集群的时候,访问量较大,使用使用nginx作为静态资源的web服务器-部署前

vue3 自定义Hooks

文章目录前言一、Hooks是什么?二、图片转换Base641.Hooks2.使用三、监听元素宽高(自定义指令+Hooks)1.Hooks2.使用总结前言本文主要记录了vue3学习中自定义Hooks和vue2中Mixins的使用与案例。一、Hooks是什么?Hooks用来处理复用代码逻辑的一些封装,Hooks与Mixin

热文推荐