2023 Google开发者大会:你了解机器学习的新动向吗?

2023-09-15 09:21:24

在这里插入图片描述

0 年度科技盛会

2023Google开发者大会在上海浦东举办,为开发者和科技爱好者们带来新技术、新产品、新动向

可能很多同学对Google 开发者大会还不熟悉,Google 开发者大会是 Google 展示最新产品和平台的年度盛会,为开发者提供丰富的学习资源、实践操作和现场演示,提供与Google专家互动、与其他开发者交流的契机,助力开发提效,释放团队创造力,简化工作流程,以开放式集成解决方案为开发者效力,共同构建创新生态,开启美好未来。

本次大会有三大核心亮点

  • 新知同享
    通过大会主旨演讲,以及涵盖Mobile开发Cloud开发Al开发Web开发的专题演讲,来自Google的专家们分享了领域内新的见解和最佳实践,帮助开发者收获技术新知识、实现技术进阶
  • 灵感齐聚
    大会设置了炉边对谈、工作坊和技术问答环节,带来形式多样、频次密集的交流互动机会。现场40多个技术与产品趣味互动展示,也带来最新技术的应用场景和创新的交互体验。这些互动和体验都能帮助开发者激发新思妙想,促进创新思维
  • 多元共进
    大会特别呈现演讲,展现了Google为不同人群(有障人士、女性开发者、出海开发者、初创从业者等等)提供丰富学习资源,带来成长机会;大会携手开发者社区举办各类丰富多彩的活动,帮助开发者通过多元形式进阶成长

本次大会的一个亮点是融合了非常多的中国元素,比如门口的红色大鼓、灯笼,还有走进敦煌、观妙中国等体验项目。这种前沿技术和传统文化的结合,向我们展示了高科技离我们并不遥远,它可以就在我们的身边,可以离我们很近

在这里插入图片描述

接下来,介绍本次大会的一些令我印象深刻的内容

1 生成式机器学习

我们知道,机器学习模型主要分为两类:

  • 判别式模型(discriminative models)
  • 生成式模型(generative models)

对于给定样本 x \boldsymbol{x} x,前者通过对后验概率 P ( y ^ ∣ x ) P\left( \hat{y}|\boldsymbol{x} \right) P(y^x)建模求得数据的最优决策边界;后者通过对联合概率 P ( x , y ^ ) P\left( \boldsymbol{x},\hat{y} \right) P(x,y^)建模求得数据各模式的决策边界。

在这里插入图片描述

机器学习模型的分类(绿色为新样本)

如图所示,判别式模型通过最优决策边界计算 P ( y ^ ∣ x ) P\left( \hat{y}|\boldsymbol{x} \right) P(y^x),并选择使 P ( y ^ ∣ x ) P\left( \hat{y}|\boldsymbol{x} \right) P(y^x)较大的 y ^ \hat{y} y^作为 x \boldsymbol{x} x的预测值;生成式模型通过比较样本 x \boldsymbol{x} x与模型各模式间的相近程度,即通过联合概率间接计算样本 x \boldsymbol{x} x对各模式的后验概率,并选择使后验概率较大的 y ^ \hat{y} y^作为 x \boldsymbol{x} x的预测值

生成式模型和判别式模型是两种截然不同的人工智能模型。判别式模型的主要任务是对给定输入进行分类或标记,而生成式模型则是根据给定的条件生成新的数据。在过去,人们只希望基于已有的给定数据做一些预测和拟合,因此判别式模型得到发展并且很好地解决了大部分任务;而未来,人们将目标转向用生成式模型生成全新数据,进行迁移学习等,也就是常说的人工智能生成内容(AI Generated Content, AIGC)

在这里插入图片描述

为什么我们需要生成全新数据?

答案很简单:我们希望提高人工智能的工作上限,就不能仅仅依靠它对已有数据的拟合,而是像人一样有一定的创新能力。

生成式模型相比判别式模型的独特优势,使之可以应对更多的任务,例如推动内容开发、视觉艺术创作、数字孪生、自动编程,甚至为科学研究提供AI视角、Al直觉…因此生成式人工智能的未来发展趋势。

本次大会展示了非常多AIGC方面的demo,一个大家比较熟悉的例子是AI绘画,在这个互动演示中,Google展示了在Google Kubernetes Engine(GKE)上部署Stable Dffusion的强大能力和可扩展性。与会者将亲眼目睹在Stable Diffusion最受欢迎的Web界面上实时生成高质量图像的过程

在这里插入图片描述

2 无障碍游戏体验

Google的技术氛围是具有包容性和国际视野的,其产品往往会考虑不同人群的实际需要。举例而言,Google推出的MST肤色量表(Monk Skin Tone Scale)可以保证面部识别、目标检测等技术对不同肤色的人群不存在偏见。

在这里插入图片描述

另一个实例是通过面部识别技术为有障人士提供更好的游戏体验。本次大会上,Google Gameface联合《荒野行动》,将机器学习和传统编码相结合,以解决面部检测和面部地标提取的挑战,并将这些信息转化为鼠标遥测的代码。通过检测玩家的面部表情和动作,游戏可以更好地理解玩家的情感和动机,从而根据这些信息提供更个性化的游戏体验。包括自动调整游戏难度、创建更具互动性的游戏角色或者提供更逼真的虚拟现实体验。

在这里插入图片描述

对有障碍人士而言,他们可以利用面部动作来代替手部操作,从而参与游戏,表达自己的情感和意愿。这种互动性能够增强他们在游戏中的参与感和满足感,享受游戏的乐趣。同时,面部表情控制游戏可以帮助他们更好地表达自己的情感,与其他玩家或角色进行情感交流。这种交流方式能够增强社交互动,减少沟通障碍。

每个人的面部表情和动作都是独特的,能否将自己的个性特点融入游戏,游戏则根据面部表情来调整角色行为或反应,使游戏体验更加个性化和独特?期待Google未来在这方面的技术动向。

3 跨平台机器学习

GoogleMediaPipe是一款用于构建跨平台、基于机器学习的视觉与感知应用程序的机器学习模型框架。它可以帮助开发人员轻松地构建AI应用程序,如物体检测、姿势估计、虚拟试衣和手部跟踪等。作为一款跨平台框架,MediaPipe不仅可以被部署在服务器端,更可以在多个移动端 (安卓和苹果 iOS)和嵌入式平台(Google Coral和树莓派)中作为设备端机器学习推理框架。MediaPipe提供了一系列机器学习管道和计算单元,以处理多种不同类型的感知数据,例如视频、音频和深度图像数据。同时,它还提供了大量的预训练模型和工具,使开发者可以快速构建高质量的视觉应用程序,而不需要编写复杂的算法和代码。

在这里插入图片描述

除此之外,MediaPipe还为开发人员提供了模块化的流水线视图,以及可以自定义的机器学习管道和组件,这些功能可以帮助开发人员更好地理解和调试他们的应用程序。此外,在移动设备上部署应用程序时,MediaPipe还优化了硬件和软件的配合,以实现更快的性能和更低的功耗。

总的来说,MediaPipe是一个强大且易于使用的开源框架,它可以帮助开发者轻松构建各种不同类型的视觉应用程序,并且在跨平台和性能方面都有良好的表现。在Google,一系列重要产品,如YouTubeGoogle LensARCoreGoogle Home 等,都已深度整合了MediaPipe

Google的Web ML技术也采用了MediaPipe,它使开发者可以创建更快、更安全和更智能的Web应用程序。与传统的机器学习应用不同,Web ML技术在安全方面有显著的优势。首先,机器学习模型可以在用户设备上本地运行,而不需要将敏感数据上传到云端进行处理。这意味着用户的数据可以得到更好的保护和隐私,并减少了数据泄露的风险。其次,通过在用户设备上进行机器学习推理和推断,Web ML技术可以减少与云端通信的需求,从而降低了网络传输过程中的数据被窃取或篡改的风险。
此外,Web浏览器提供了一个沙箱环境,用于隔离和限制JavaScript代码的访问权限。这可以防止恶意代码对机器学习模型或用户数据的篡改或滥用。

目前Web端机器学习也成为机器学习应用的新方向

总结

这次大会为与会者提供了许多有价值的活动和机会。首先是主旨演讲和专题演讲,我深刻感受到了Google专家们对技术的热情和追求。想要进一步了解Google最新开发技术和产品的小伙伴可以点击下方链接,前往CSDN大会专题页,这里有很多精选的专题回放视频,帮助你深入了解Google前沿技术。

在现场 40 多个技术与产品趣味互动展示中,我们可以深入了解Google最新的科技产品和解决方案,并学习如何最好地利用这些工具进行开发和创新。在这里,可以非常自由地分享彼此的创新想法,交流经验并建立联系。这种互动展示了科技行业不断创新的活力和潜力。

总的来说,Google开发者大会是一个汇聚技术创新和凝聚开发者社区的重要平台。通过这次盛会,我们不仅能够获取最新的行业动向和见解,而且还能获得宝贵的学习、交流和合作机会。

对于大会上了解的新知识、新技术,大家可以在Google开发者在线课程进一步巩固和练习。

Google开发者大会,下次见!


🔥 更多精彩专栏


👇源码获取 · 技术交流 · 抱团学习 · 咨询分享 请联系👇
更多推荐

MyBatis获取参数值的两种方式#{}和${} 以及 获取参数值的各种情况

一、参数值的两种方式#{}和${}在MyBatis中,可以使用两种方式来获取参数值:#{}和${}。1.#{}:这是MyBatis推荐使用的方式。在SQL语句中使用#{},MyBatis会自动将参数值进行预编译处理,防止SQL注入攻击,并且可以处理各种类型的参数(如字符串、数字、日期等)。例如:<selectid="g

【音视频原理】音视频 “ 采样 - 编码 - 封装 过程 “ 和 “ 解封装 - 解码 - 播放 过程 “ 分析 ( 视频采集处理流程 | 音频采集处理流程 | 音视频文件解封装播放流程 )

文章目录一、视频采集处理流程二、音频采集处理流程三、音视频文件解封装播放流程本篇文件主要分析音视频文件是怎么产生的,以及音视频文件是如何播放的;一、视频采集处理流程视频文件从录像到生成文件的全过程:采集图像帧:摄像头硬件负责采集画面,采集的初始画面称为"图像帧",一秒钟采集的图像帧数量称为"帧率",如:60帧就是一秒钟

网络安全(黑客)自学

目录:一、什么是网络安全二、怎样规划网络安全三、网络安全的知识多而杂,怎么科学合理安排?1、基础阶段2、渗透阶段3、安全管理(提升)这一阶段主要针对已经从事网络安全相关工作需要提升进阶成管理层的岗位。如果你只学习参加工程师方面的岗位,这一阶段可学可不学。4、提升阶段(提升)1、Web安全相关概念(2周)2、熟悉渗透相关

Web Components详解-Shadow DOM基础

目录引言概念基本用法attachShadow函数mode(模式)delegatesFocus(委托聚焦)CustomElements+ShadowDOM基本用法样式及属性隔离写在最后相关代码参考文章引言上篇文章的自定义标签中,我们使用customElements对象对原生标签进行拓展,达到组件的拓展性与复用性的效果,那

Spring Boot集成EasyExcel实现数据导出

在本文中,我们将探讨如何使用SpringBoot集成EasyExcel库来实现数据导出功能。我们将学习如何通过EasyExcel库生成Excel文件,并实现一些高级功能,如支持列下拉和自定义单元格样式,自适应列宽、行高,动态表头,以及如何同时导出多个sheet页的数据。引入依赖首先,我们需要在pom.xml文件中添加E

【前端系列】前端如何使用websocket发送消息

序言今天来学习一下前端如何使用websocket发送消息1基础介绍1.1什么是WebSocketWebSocket是一种在单个TCP连接上进行全双工通信的协议,它可以让客户端和服务器之间进行实时的双向通信。与传统的HTTP请求不同,WebSocket使用了一个长连接,在客户端和服务器之间保持持久的连接,从而可以实时地发

TCP 和 UDP 的 Socket 调用

在网络层,Socket函数需要指定到底是IPv4还是IPv6,分别对应设置为AF_INET和AF_INET6。另外,还要指定到底是TCP还是UDP。TCP协议是基于数据流的,所以设置为SOCK_STREAM,而UDP是基于数据报的,因而设置为SOCK_DGRAM。TCP的服务端要先监听一个端口,一般是先调用bind函数

若依框架集成WebSocket带用户信息认证

一、WebSocket基础知识我们平时前后台请求用的最多的就是HTTP/1.1协议,它有一个缺陷,通信只能由客户端发起,如果想要不断获取服务器信息就要不断轮询发出请求,那么如果我们需要服务器状态变化的时候能够主动通知客户端就需要用到WebSocket了,WebSocket是一种网络传输协议,同样也位于OSI模型的应用层

c++学习之十四

1)利用std::function实现回调函数,实现生产者及消费者模型//254、回调函数的实现//在消息队列和网络库的框架中,当接收到消息(报文)时,回调用户自定义的函数对象,把消息(报文)参数传给它,由它决定如何处理。//示例://254、回调函数的实现//在消息队列和网络库的框架中,当接收到消息(报文)时,回调用

【2023】Redis相关面试题

1.Redis是什么?它有什么特点?答:Redis是一个使用C语言编写的开源、高性能、支持多种数据结构的NoSQL数据库。支持多种数据结构,如字符串、哈希表、列表、集合、有序集合等。数据存储在内存中,可以快速读写。支持数据持久化,可以将数据保存到磁盘上。提供了丰富的功能,如发布订阅、事务、Lua脚本等。具有高可用性和可

jvm面试题

jvm内存区域Q:jvm内存区域怎么划分的?答:堆内存(线程共享):所有线程共享的一块区域,垃圾收集器管理的主要区域。主要存储对象、数组。Java堆中还可以细分为:新生代和老年代;再细致一点的有Eden空间、FromSurvivor空间、ToSurvivor空间等,默认情况下新生代按照8:1:1的比例来分配。程序计数器

热文推荐