【藏经阁一起读】(69)__《阿里云视频云产品手册2023版》

2023-09-15 16:49:56

【藏经阁一起读】(69)__《阿里云视频云产品手册2023版》

目录

一、概述阿里云视频云全产品矩阵

二、数字人视频制作

以下是人工智能虚拟人物的一些优秀代表作品及其特点:

阿里云视频云数字人视频制作产品优势

▶高还原度的拟真效果

▶场景化智能AI联动处理

▶丰富的衍生制作能力

▶灵活的应用方案

阿里云视频云数字人视频制作产品能力

▶数字人形象训练及渲染

▶人声克隆训练及渲染

▶场景化视频抠图

▶模板化视频成片及精编二创

▶数字人直播实时互动

三、感触

image.png

一、概述

  这个产品手册一共分为五章,阿里云视频云、视频服务、智能媒体服务、媒体开发服务、生态合作

image.png

阿里云视频云全产品矩阵

image.png

二、数字人视频制作

  手册中智能媒体部分有介绍数字人视频制作的。
  虚拟人物生成是一种人工智能技术,即使用深度学习算法训练庞大的数据集来创造高质量的虚拟人物或角色。
  这种技术的创意背景可以是游戏开发、电影制作、虚拟现实、社交媒体、人机交互等领域。
  该技术可用于创造真实感、表现力、交互性强的虚拟人物,进而拓展用户体验的多样化与个性化。

  数字人视频制作(Digitalizepro)整合仿真形象渲染、声音克隆和视频精编二创等多种能力,开放数字人形象和人声特征克隆模型的自助训练,基于文字或语音驱动数字人,后期可基于数字人应用的场景添加动态视频、图片、字幕、特效等生成数字人视频成片,为用户提供一站式数字人视频制作服务。

2023-09-07_061659.png

  以下是人工智能虚拟人物的一些优秀代表作品及其特点:

作品名称代表角色特点
Siri苹果公司智能语音助手,能回答问题、执行命令、发送信息等
Cortana微软公司智能语音助手,类似Siri,但更加个性化,能获取更多的信息并预测用户需求
WatsonIBM公司人工智能平台,能进行自然语言处理、机器学习和数据分析等任务
Xiaoice微软中国语音交互式人工智能机器人,能扮演聊天伴侣、情感陪伴和知识助手等角色
ReplikaLuka公司基于聊天机器人技术的虚拟人物,能模拟人类情感和思维,通过聊天与用户建立情感连结
MitsukuPandorabots公司多次获得Loebner人工智能对话竞赛冠军的聊天机器人,能与用户进行自然语言对话并提供各种服务和功能
Erica株式会社人工智能(日本)由大量对话数据训练而成的人工智能虚拟人物,能模拟人类情感和行为,被称为“最人性化”的机器人
GPT-3OpenAI自然语言处理模型,具有惊人的语言生成能力,能够产生连贯、逻辑的自然语言文本
AvatarMind RobotAvatarMind公司拥有机器视觉、语音识别、自然语言处理和运动控制等多种功能的机器人,被称为“智慧之脑机器人”。

阿里云视频云数字人视频制作产品优势

▶高还原度的拟真效果
  • 基于阿里云多年的技术沉淀和研发实力,持续迭代调优渲染算法依靠高性能的硬件资源,保障高品质的渲染效果和高效的任务处理
▶场景化智能AI联动处理
  • 支持人声克隆,形象拟真和人声拟真,实现人物形象IP整体复刻
  • 支持绿幕或实景抠图,灵活的人物及附属物选择,实现视频成片精细化预处理
▶丰富的衍生制作能力
  • 开放强大的视频制作工具,可对数字人源素材进行高质量二次创作,输出视频成片提供强大的视频模板创作工具,将结构化视频预设为模板,实现自动批量化模版成片
▶灵活的应用方案
  • 支持PaaS级灵活接入,提供数字人训练及渲染、视频精编等多种 API 和 WebSDK 接口支持互动直播场景的SaaS服务,支持数字人脚本、数字人互动预设、直播间装修等服务

2023-09-07_052929.png

阿里云视频云数字人视频制作产品能力

▶数字人形象训练及渲染
  • 基于输入的文本或语音驱动经过算法训练的2D仿真人进行表情和动作等拟真表达
  • 基于输入的文本、语音、动作指令等,驱动建模的卡通形象完成丰富的动画表达
▶人声克隆训练及渲染
  • 20句话简单录制,系统自动分配录制文案
  • 3大细分场景支持,故事、交互、导航
  • 30分钟完成克隆,便捷快速复刻人声
▶场景化视频抠图
  • 高质量视频抠图:准确识别发丝细节、人物边缘等,支持局部优化,抠出图像内容边界清晰自然无残漏
  • 灵活定义抠图范围:在抠出人像的同时,可指定抠出人像附属物,如桌面,手持物品、装置道具等
  • 背景环境融合自适应:在不同光线及色彩环境下,自动调整数字人适配不同环境,保障视频成片自然统一
▶模板化视频成片及精编二创
  • 提供模板化创作工具,利用非线编编辑器或AE制作模板库,结合数字人自动化渲染,提供数字人名片、数字人慕课等多种模板组合方案,为用户提供批量化和高品质的数字人视频生产工具箱
▶数字人直播实时互动
  • 针对数字人互动直播的标准场景,提供开箱即用的SaaS工具
  • 实现直播间装修、数字人脚本设定、互动方案预置、一键开播等完整的可视化配置服务

三、感触

我尝试过其他数字人的制作,

image.png

不知道基于阿里云视频云的数字人制作如何,找个时间尝试一下。

         推荐阅读:

大数据的关键技术之——大数据采集
[你找到牵手一辈子的人了吗?] 七夕情人节特辑
数字技术能让古籍“活过来”吗?
心情不好时,帮自己训练个AI情绪鼓励师吧(基于PALM 2.0 finetune)
深度学习框架TensorFlow
人工智能开发人员工作流程、看法、工具统计数据
2023 年6月开发者调查统计结果——最流行的技术(2)
2023 年6月开发者调查统计结果——最流行的技术(1)
让Ai帮我们画个粽子,它会画成什么样呢?

9e598365ba5344e282453e71a676a056.jpeg​​

b9b9f2b9374646798ca554110a498cda.jpeg​​

23f61e3eac99458296be0fedea10019e.jpeg​​

给照片换底色(python+opencv)猫十二分类基于大模型的虚拟数字人__虚拟主播实例

bfa502b957c247a7872d7e645d4c6f03.jpeg​​

2f073e39924e42d2b33221f4262dcc1d.jpeg​​

9d7e2b6a00aa45fd82291f0d5f9eea7e.jpeg​​

计算机视觉__基本图像操作(显示、读取、保存)直方图(颜色直方图、灰度直方图)直方图均衡化(调节图像亮度、对比度)

01bfb23f2f894ee0b0164f52e57bbbbc.png​​

47c92d6cf9fe4d279a142480a4340a0d.png​​

1620a2a7b0914c42b3a8254e94269a79.png​​

语音识别实战(python代码)(一)

 人工智能基础篇

 计算机视觉基础__图像特征

93d65dbd09604c4a8ed2c01df0eebc38.png​​

 matplotlib 自带绘图样式效果展示速查(28种,全)

074cd3c255224c5aa21ff18fdc25053c.png​​

Three.js实例详解___旋转的精灵女孩(附完整代码和资源)(一)

fe88b78e78694570bf2d850ce83b1f69.png​​

62e23c3c439f42a1badcd78f02092ed0.png​​

cb4b0d4015404390a7b673a2984d676a.png​​

立体多层玫瑰绘图源码__玫瑰花python 绘图源码集锦

 Python 3D可视化(一)

让你的作品更出色——词云Word Cloud的制作方法(基于python,WordCloud,stylecloud)

e84d6708316941d49a79ddd4f7fe5b27.png​​

938bc5a8bb454a41bfe0d4185da845dc.jpeg​​

0a4256d5e96d4624bdca36433237080b.png​​

 python Format()函数的用法___实例详解(一)(全,例多)___各种格式化替换,format对齐打印

 用代码写出浪漫__合集(python、matplotlib、Matlab、java绘制爱心、玫瑰花、前端特效玫瑰、爱心)

python爱心源代码集锦(18款)

dc8796ddccbf4aec98ac5d3e09001348.jpeg​​

0f09e73712d149ff90f0048a096596c6.png​​

40e8b4631e2b486bab2a4ebb5bc9f410.png​​

 Python中Print()函数的用法___实例详解(全,例多)

 Python函数方法实例详解全集(更新中...)

 《 Python List 列表全实例详解系列(一)》__系列总目录、列表概念

09e08f86f127431cbfdfe395aa2f8bc9.png​​

6d64357a42714dab844bf17483d817c0.png​​

用代码过中秋,python海龟月饼你要不要尝一口?

 python练习题目录

03ed644f9b1d411ba41c59e0a5bdcc61.png​​

daecd7067e7c45abb875fc7a1a469f23.png​​

17b403c4307c4141b8544d02f95ea06c.png​​

草莓熊python turtle绘图(风车版)附源代码

 ​草莓熊python turtle绘图代码(玫瑰花版)附源代码

 ​草莓熊python绘图(春节版,圣诞倒数雪花版)附源代码

4d9032c9cdf54f5f9193e45e4532898c.png​​

c5feeb25880d49c085b808bf4e041c86.png​​

 巴斯光年python turtle绘图__附源代码

皮卡丘python turtle海龟绘图(电力球版)附源代码

80007dbf51944725bf9cf4cfc75c5a13.png​​

1ab685d264ed4ae5b510dc7fbd0d1e55.jpeg​​

1750390dd9da4b39938a23ab447c6fb6.jpeg​​

 Node.js (v19.1.0npm 8.19.3) vue.js安装配置教程(超详细)

 色彩颜色对照表(一)(16进制、RGB、CMYK、HSV、中英文名)

2023年4月多家权威机构____编程语言排行榜__薪酬状况

aa17177aec9b4e5eb19b5d9675302de8.png​​​

38266b5036414624875447abd5311e4d.png​​

6824ba7870344be68efb5c5f4e1dbbcf.png​​

 手机屏幕坏了____怎么把里面的资料导出(18种方法)

【CSDN云IDE】个人使用体验和建议(含超详细操作教程)(python、webGL方向)

 查看jdk安装路径,在windows上实现多个java jdk的共存解决办法,安装java19后终端乱码的解决

1408dd16a76947e4a7eb3c54cd570d95.png​​

vue3 项目搭建教程(基于create-vue,vite,Vite + Vue)

fea225cb9ec14b60b2d1b797dd8278a2.png​​

bba02a1c4617422c9fbccbf5325850d9.png​​

37d6aa3e03e241fa8db72ccdfb8f716b.png​​

2023年春节祝福第二弹——送你一只守护兔,让它温暖每一个你【html5 css3】画会动的小兔子,炫酷充电,字体特

 别具一格,原创唯美浪漫情人节表白专辑,(复制就可用)(html5,css3,svg)表白爱心代码(4套)

SVG实例详解系列(一)(svg概述、位图和矢量图区别(图解)、SVG应用实例)

5d409c8f397a45c986ca2af7b7e725c9.png​​

6176c4061c72430eb100750af6fc4d0e.png​​

1f53fb9c6e8b4482813326affe6a82ff.png​​

【程序人生】卡塔尔世界杯元素python海龟绘图(附源代码),世界杯主题前端特效5个(附源码)HTML+CSS+svg绘制精美彩色闪灯圣诞树,HTML+CSS+Js实时新年时间倒数倒计时(附源代码)

 2023春节祝福系列第一弹(上)(放飞祈福孔明灯,祝福大家身体健康)(附完整源代码及资源免费下载)

fffa2098008b4dc68c00a172f67c538d.png​​

5218ac5338014f389c21bdf1bfa1c599.png​​

c6374d75c29942f2aa577ce9c5c2e12b.png​​

 tomcat11、tomcat10 安装配置(Windows环境)(详细图文)

 Tomcat端口配置(详细)

 Tomcat 启动闪退问题解决集(八大类详细)

更多推荐

PostgreSQL 命令行工具介绍

文章目录前言1.连接数据库1.1psql本地连接1.2psql远程连接1.3指定客户端字符集2.pg_ctl管理命令2.1初始化数据库2.2启动数据库2.3加载配置文件2.4查看数据库状态3.数据库信息查看3.1查看数据库版本3.2查看数据库的启动时间3.3查看配置文件load时间3.4查看当前连接用户3.5查看修改参

道可云元宇宙每日资讯|首届报业传媒元宇宙应用大会在青岛开幕

道可云元宇宙每日简报(2023年9月22日)讯,今日元宇宙新鲜事有:元宇宙与人工智能时代的出版与阅读研讨会举行由中国新闻出版研究院元宇宙出版与阅读实验室、北京印刷学院数字出版前沿技术应用创新联合实验室主办的元宇宙与人工智能时代的出版与阅读研讨会今天在敦煌举行。与会嘉宾围绕通用人工智能在出版行业应用现状与发展方向、元宇宙

思腾云计算

思腾合力(SITONHOLY)是AI服务器与HPC基础架构解决方案商,作为NVIDIA精英级别的合作伙伴,一直专注于人工智能领域。思腾合力拥有自主品牌GPU服务器及通用X86服务器,适用于深度学习训练及推理等场景,覆盖服务器、静音工作站等多种产品形态。在人工智能硬件领域深耕的同时,也在软件领域不断探索发展,独立开发的S

Java日志

加油,新时代打工人!一、日志分级最开始的日志分级是由Syslog的开发者EricAllman在1981年提出的。之后,这个级别分级系统被广泛应用于各种领域的日志记录和信息处理中。下面我们就来介绍下常用的日志等级TRACE;是最低级别的日志记录,用于输出最详细的调试信息,通常用于开发调试目的。在生产环境中,应该关闭TRA

SG-Former实战:使用SG-Former实现图像分类任务(一)

摘要SG-Former是一种新型的Transformer模型,它被提出以降低视觉Transformer的计算成本,同时保持其优秀的性能表现。计算成本的降低使得SG-Former能够更有效地处理大规模的特征映射,从而提高了模型的效率和全局感知能力。SG-Former的核心思想是利用显著性图来引导Transformer模型

leetcode 236.二叉树的最近公共祖先

⭐️题目描述🌟leetcode链接:二叉树的最近公共祖先思路1:依次遍历每一个结点,遍历到当前根结点,再继续递归找p是否存在左子树q是否存在右子树,若p在左子树q在右子树或者q在左子树p在右子树,说明当前root就是qp的公共祖先,若当前结点找不到这种情况,则当前root转换为子问题root->leftroot->r

343. 整数拆分

题目:343.整数拆分给定一个正整数n,将其拆分为k个正整数的和(k>=2),并使这些整数的乘积最大化。返回你可以获得的最大乘积。示例1:输入:n=2输出:1解释:2=1+1,1×1=1。示例2:输入:n=10输出:36解释:10=3+3+4,3×3×4=36。提示:2<=n<=58思考历程与知识点:看到这道题目,都会

信息化发展44

智能运维1、中国电子工业标准化技术协会发布的团体标准I/CESA1172《信息技术服务智能运维通用要求》,给出了智能运维能力框架,包括组织治理、智能特征、智能运维场景实现、能力域和能力要素,其中能力要素是构建智能运维能力的基础。2、组织通过场景分析、场景构建、场景交付和效果评估四个过程,基于数据管理能力域提供的高质量数

关于mysql已有主从环境得主从重配置

恢复主从环境1:Situation(背景)2:Task(任务)3:Action(行动)主库(备份)1:锁表2:效验是否锁表3:查看主库状态并记录4:备份数据库全部5:解锁表6:把备份放到从库从库1:备份从库(可选)2:恢复从库3:清除旧设置4:添加新设置4:Result(结果)1:Situation(背景)测试环境下得

片内互联中常用的拓扑结构

主要的拓扑结构有星型(Star)、交叉(Crossbar)、总线(Bus)、环型(Ring)和网格(Mesh)等。星型(Star)结构,主控处理器放在中心位置,其他各个模块均与其连接,而模块彼此之间并不直接交互,必须通过主控中转,结构如图1所示。这种结构简单高效,在早期片内模块数量较少、结构单一时经常被使用。但随着多核

9.21数电(加法器&状态机&独热编码)

加法半加器一位,分为两部分,一个是进位,一个是单位上的和进位采取与门,单位上的和用异或门全加器进位数就是三个数进行加和,通过与门,就是两两过与门描述每位的和项就是,只去描述那个1的情况,即三中有一个,或者三个都为1分解全加器行波进位加法器快速加法器是说下一位的进位=此位的两个加数再加上来自上位的进数当此位的两个加数均为

热文推荐