汉王副总裁李志峰说,汉王OCR技术所实现的巨大软件功能,以前基本上都是在给别人作嫁衣裳,汉王要想真正培养自己的竞争力,必须走软硬结合的道路………
日前,汉王在公司向与会媒体展现了最新产品,被汉王称之为“抄书机”的――汉王文本仪。这款基于汉王最新OCR技术成果的产品,不但具有巨大、先进的产品功能,更重要的是,展示了汉王在相关领域技术战略和产品战略的转变。作为全球第一款能够实现文本识别和输入的产品,文本仪的诞生对汉王的意义不言而喻。
国内OCR技术发源
文字识别技术一直是汉王最核心的技术。在这方面,汉王已经耕耘了二十年的时间,如果从实验室、技术研发来讲已经超过二十年的历史。在国内市场上,汉王公司是OCR技术当之无愧的领导者,即使在国际上,汉王所具有的中文识别技术也是最先进的。基于汉王在OCR技术上的积累,汉王在前几年先后推出了名片通、汉王笔、文本王等产品,形成了比较成熟的应用,特别是名片通和文本王都得到了良好的市场反映。汉王笔至今也有几百万用户在使用。作为专业录入的代表产品,文本王现在已经拥有几十万的客户。
在其他行业,汉王OCR应用也日趋成熟,例如一些票据,税票,银行票据,海关票据,各种证件的应用。此外,在车牌的识别和自动交通上,都可以看到汉王OCR技术的应用。这些应用,都跟汉王的一项专业技术有关,这就是模式识别或者识别技术。
汉王文本王是一款嫁接在扫描仪上的产品。凭借强大的软件能力,汉王文本王使得原来简单的扫描仪应用功能得到创造性革命,使得扫描仪对传统扫描件的转换也更为方便。但随着用户基数的不断扩大,汉王逐渐发现了这样一个事实:汉王独有的具有强大功能的OCR软件产品正在沦为扫描仪附带的一个功能,也就是说用户对汉王OCR技术认知正在弱化。“我们以前文本王这个市场,客户总是认为我们是扫描仪,总认为我们是一般扫描仪。很多用户在问的时候直接说,你们扫描仪多少钱,这样根本没有体现我们的产品价值和核心技术”汉王副总裁兼OCR产品总经理李志峰说。同时,随着文本王应用的逐渐深入,汉王发现扫描仪的硬件条件下,满足不了顾客的进一步对于文本转换的需求,例如教育行业中存在的大量对书籍文本的转换。扫描仪在硬件上的局限也已经大大限制了汉王OCR技术的进一步应用。
汉王文本仪问世
汉王逐渐明白了一个道理,要想使得OCR技术在应用上获得进一步发展,摆脱对其他硬件的依赖是关键。在这种情况下,汉王决心研制自己的硬件产品。于是,在汉王二十多位技术骨干近两年时间研发,汉王文本仪问世。“以前我们是软件,绑给硬件厂商。把我们最值钱的东西给人家当嫁衣裳,我们现在要以我们的技术为核心,根据用户需求来出产品”李志峰说。
当然,与以前汉王产品相比,汉王文本仪最大的特点就是硬件的创新。为了体现与文本差异性,汉王文本仪硬件具有较大的厚度,体积加大,按键丰富,汉王的目的就是从视觉上要突出这种差异,满足用户个人心态上的需求。
汉王文本仪不但在硬件上取得了创新,更为重要是其所具备的四个显著特点大大满足了客户的应用需求。首先是侧翻盖方式。一般扫描仪采用正翻盖。而文本仪采用侧翻盖,就是要体现差异性,满足用户扫书需求,一键即可。其次是文本仪的超短边距或者无边距设计,大大方便书籍扫描。第三,批量模式和单页模式并存。第四,独立开关设计,符合绿色环保,节能减排的需求。
汉王是这样定义文本仪的。文本仪是一种可对纸质资料和可视电子文件中的图文元素进行准确提取,智能识别,并可实时文本转化的一种设备。这样汉王把文本仪和以前的扫描仪产品做了区分。传统的扫描仪主要定位在图象获取设备,而文本仪则重在转化上。文本仪的处理对象,除了纸质的东西以外,还包括所有的办公文件、名片、报纸、杂志、书刊、电子文件,电子文件,并且不局限于纸质文件,电子文件我们能看见的jpeg、tif、PDF、bmp等等,它们这种元素,文字、公式、方程式、表格,包括红章、红头图象所有这些人们见到的东西,都要把它复活起来。这正是文本仪诞生的初衷。文本仪分为科教版和公务版,前者针对对公式输入有特殊需求的教育市场,后者则针对对公章、红头文件等有特殊需求的政府办公市场。
汉王希望文本仪能够在办公设备领域开创一个新的品类。
行业应用需求催生技术创新
汉王产品经理董可清楚地记得当时的情景:“当时我记得在南京出差的时候,有一个教授过来买文本王跟我们讲要退货,说你们当时说什么都能扫,可我们搞专业研究有一些书籍,一般扫描仪根本搞不定,书籍翻开后两页之间的阴影根本识别不了,图象采集有问题……”
针对这样的情况,后来汉王做了详细的客户研究。发现60%的教育用户都有扫描书籍的这种需求,政府类40%用户也有类似的需求,因为政府办公过程中常常要把印刷好的杂志,书刊进行重新的利用。对这种需求,扫描仪显然勉为其难;另外随着从纸张到书籍的转变,印刷技术越来越发展,印刷的稿件已经不单纯是原来功能式的白纸黑字的稿件,而是印刷形态更加复杂,包含更加鲜艳的颜色,更加复杂的排版方式。同时,各行各业的用户需求方式也不一样,教育界的用户需求的资料里除了文字以外,还有很多科学符号、公式和表格,对于公式识别,目前在全世界都无法做到;另外政府办公资料形态也不一样,有公章,有红头,档案系统等等……这种丰富多彩的需求,就需要相关厂商能够重新做一个产品整合。
“针对用户的需求,汉王总共用了一年多的时间进行开发,从产品的形成到软硬件的开发,还有我们整合又用了一年多的时间,也投入了相当的人力,在软硬件工程师方面,有一二十位,集中了基本上我们很多研发力量来做的。我们这款产品我们希望在办公的资料录入这一块,争取设立一个标准,这个体现在它不仅仅是一个OCR的技术,更多体现在是一个用户可用的产品”。汉王副总裁李志峰说。
也正是因为在产品开发过程中认真贯彻了为应用开发的理念,文本仪在硬件上的诸多功能非常具有针对性。李志峰总结到,文本仪的扫描的速度,输入速度,还有它的可操作方式,适应资料的范围,比如书本,厚书可以进行不拆开录入。另外在硬件改进的基础上,汉王在多年OCR研究基础上,软件方面也取得了突破。第一是公式识别的文本录入。目前汉王是世界上第一家能够做到实用化的公式自动识别录入的厂商,而且效果而也非常好。经过产品前期销售,受到广大用户的欢迎。
文本仪是汉王从纯软件OCR技术到实体产品迈出的第一步,也明确了汉王在OCR技术发展上的发展思路。汉王希望通过努力,真正打开文本录入市场,争取能够在办公产品这个领域开拓一个新的市场机会。让汉王的软件产品真正“硬”起来。
(新闻稿 2007-09-06)