夸克扫描王识别精度领跑行业 愿携手各方伙伴探索AIGC应用新范式

2023-09-22 15:04:17

日前,在“AIGC与场景化应用创新”主题研讨会上,阿里智能信息事业群夸克视觉技术负责人黄锐华分享了AI技术应用于扫描场景的最新成果。他表示,AIGC给手机扫描产品打开了创新空间,搭载大模型技术的夸克扫描王对识别手写字体、复杂公式和版式理解上的准确率达到了新高度。

d134956065eb475a965c111edd2f594f.png 

(夸克视觉技术负责人:黄锐华)

经过几十年的发展,扫描技术已经日趋成熟,但是随着拍摄屏幕等新场景和用户编辑图片等个性化需求的出现,扫描行业面临着全新的机会。尤其是大模型和AIGC在大数据建模、文本理解以及内容生产带来的颠覆性变化,将给用户和企业带来新一轮的效率提升。

黄锐华表示,夸克扫描王已形成扫描能力、图像能力、内容识别和版式理解能力及学习效率工具的能力矩阵。基于自身数据多、精度高、能力全等特点,夸克扫描王愿意将自研的多项技术和能力优先开放给行业伙伴,共同开创AIGC时代下的数字服务新生态。

307a8f4034fb4af1b7b9221d0639a7c4.png 

众所周知,教育行业对扫描技术识别率、处理速度的要求非常高。黄锐华介绍,AIGC已经在扫描的识别精度、任务类型及应用场景等方面实现突破。以夸克扫描王的识别精度为例,目前手写字符识别准确率超过99%;复杂公式识别准确率99%;识别模糊文本和复杂公式的识别率远超行业水平。夸克扫描王在学习、工作等场景下的技术突破,正在加快推动生产力工具的智能化和数字化。

不久前,应用了最新AI大模型技术能力的夸克扫描王App上线。基于大语言模型的结果优化,夸克扫描王能够在复杂场景下模仿人类思维,更精准地识别、分析和提取文字、公式及图片等内容,从而实现更完美的扫描效果。

黄锐华透露,未来,夸克扫描王还会依托大模型技术在四方面进行持续突破。首先是扫描的能力,会覆盖更多真实的用户场景。其次是图像处理能力,让技术提升扫描质量。再次是内容理解能力,让大模型会像人一样去思考和解析内容。最后是提供更多智能化的工具,提升用户解决问题的效率。

据QuestMobile发布的《2023年轻人群智能效率应用研究》报告显示,夸克扫描王借助大模型技术加持,突破传统扫描仪的场景壁垒,满足年轻人群个性化需求,夸克中00后、90后人群占比位列同类产品第一。

更多推荐

(总目录)springboot - 实现zip文件上传并对zip文件解压, 包含上传oss

全文目录,一步到位1.本文概述1.1本文简介2.功能实现2.1统一文件校验2.2普通(多)文件上传[服务器]2.2.1controller层2.2.2service层2.2.3业务impl实现类2.2.4FileIOUtils工具包代码2.3zip文件的解压2.4图片文件的压缩2.5oss文件后端上传2.6oss文件前

九、【漏洞复现】Struts 2 远程代码执行漏洞s2-046(CVE-2017-5638)

九、【漏洞复现】Struts2远程代码执行漏洞s2-046(CVE-2017-5638)9.1、漏洞原理Struts2是一个基于MVC设计模式的Web应用框架,本质上相当于一个Servlet,在MVC设计模式中,Struts2作为控制器来建立模型与视图进行数据交互。攻击者通过发送恶意构造的HTTP数据包利用该漏洞(通过

vue 把echarts封装成一个方法 并且从后端读取数据 +转换数据格式 =动态echarts 联动echarts表

1.把echarts在methods封装成一个方法mounted在中调用折线图和柱状图mounted调用下边两个方法mounted(){//最早获取DOM元素的生命周期函数挂载完毕console.log('mounted-id',document.getElementById('charts'))this.line()

Comparator 接口使用方法,结合java8新特性及源码分析

目录1Comparator介绍1.1函数式声明1.2简单的小案例2.Comparator中的方法2.1compare抽象方法例子2.2comparing方法源码参考解释详细解释<?superT,?extendsU>讲解comparing代码样例例子comparing中的方法源码分析<T,UextendsComparab

安防视频/视频汇聚平台EasyCVR使用onvif探测添加设备通道详细步骤来啦!

视频云存储/安防监控EasyCVR视频汇聚平台基于云边端智能协同,支持海量视频的轻量化接入与汇聚、转码与处理、全网智能分发、视频集中存储等。音视频流媒体视频平台EasyCVR拓展性强,视频能力丰富,具体可实现视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、H.2

Nginx

概念nginx什么是nginxnginx是一个高性能的HTTP和正、反向代理的服务器nginx可以干什么可以作为web服务器,可以实现反向代理,可以实现基于反向代理的负载均衡,可以作为静态资源服务器(类似于七牛云)什么时候使用nginx后台搭建集群的时候,访问量较大,使用使用nginx作为静态资源的web服务器-部署前

vue3 自定义Hooks

文章目录前言一、Hooks是什么?二、图片转换Base641.Hooks2.使用三、监听元素宽高(自定义指令+Hooks)1.Hooks2.使用总结前言本文主要记录了vue3学习中自定义Hooks和vue2中Mixins的使用与案例。一、Hooks是什么?Hooks用来处理复用代码逻辑的一些封装,Hooks与Mixin

Python+selenium自动化生成测试报告

批量执行完用例后,生成的测试报告是文本形式的,不够直观,为了更好的展示测试报告,最好是生成HTML格式的。unittest里面是不能生成html格式报告的,需要导入一个第三方的模块:HTMLTestRunner一、导入HTMLTestRunner1.这个模块下载不能通过pip安装了,只能下载后手动导入,下载地址:htt

使用Java中SSM技术写项目具体操作流程

确定需求和技术选型首先需要明确项目的功能需求,以及选择合适的技术框架和库。在SSM框架中,Spring框架负责管理Java对象,提供依赖注入和面向切面编程的功能;SpringMVC框架负责处理请求和响应,实现MVC架构;MyBatis框架负责ORM(对象关系映射),简化数据库操作。创建SpringMVC工程使用Mave

算法与设计分析--分治算法的设计与分析

某不知名学校的第二次算法实验报告,一共四道题全部来自力扣第一题​​​​​​169.多数元素题目描述:给定一个大小为n的数组,找到其中的多数元素。多数元素是指在数组中出现次数大于⌊n/2⌋的元素。你可以假设数组是非空的,并且给定的数组总是存在多数元素。示例1:输入:[3,2,3]输出:3示例2:输入:[2,2,1,1,1

基于springboot会员制医疗预约服务管理信息系统springboot017

大家好✌!我是CZ淡陌。一名专注以理论为基础实战为主的技术博主,将再这里为大家分享优质的实战项目,本人在Java毕业设计领域有多年的经验,陆续会更新更多优质的Java实战项目,希望你能有所收获,少走一些弯路,向着优秀程序员前行!🍅更多优质项目👇🏻👇🏻可点击下方获取🍅文章底部或评论区获取🍅Java项目精品实

热文推荐