CXL 重写算法(1 / 2)



当得知之前的模型构建思路要推翻重来时,杨蔓萌一点儿都没感到意外。

看着张桑桑那双没有焦距的眼睛,她只提出了一个问题:“谁去?”

对,没错。因为尝试从硬件和图源两方面改进,却仍然无法提高目前“超感OCR”算法的识别率,所以只能抛弃已有的成熟算法,从底层构建一个“真正的”“伪”超感视觉OCR。

之所以称“伪”,是因为仍然要使用超感视觉下记录的视网膜信号图像。而“真正的”一词,则“真正”在要通过改变算法来适应超感视觉生成的“伪图像”,而非通过对“伪图像”进行增强来适应算法。

然而由于包括OCR在内的图像识别算法向来属于公共知识,鲜少有涉密专家研究此领域,“超感OCR镜片”课题组自然也没有招募这方面的成员。又因为要想对超感视觉“伪图像”专门设计一套图像识别算法,就势必涉及到对“伪图像”内容的解析,这是不可能拆成小课题分包给非保密单位的,所以只能由“超感OCR镜片”课题组的内部成员完成。

但是算法的事儿,写不出来就是写不出来。所以要派一个人找不涉密的专家学习,学完了再回来自己写。

杨蔓萌问的就是要派谁去学习的问题。

对此,张桑桑先是战术性喝水,而后放下茶杯,伸出一只白皙优美的手,拍了拍杨蔓萌的肩:“晚梦,就你去吧。虽然不是CS出身,但你在人际关系上有优势。”

杨蔓萌知道,她指的是绘文集团。别的不说,这做互联网视频平台的就算再不干人事儿,也必须得有一套世界顶级的OCR系统。

“唉呀,也好。”杨蔓萌瘫倒在办公桌前,“这是我应得的。”



杨蔓萌离开涉密地点,到医大图书馆用公共电脑连上了网。她搜了一圈儿绘文集团为署名单位的文献,发现了一个令人惊讶的事实——绘文集团涉及OCR的专利,竟然大部分都是颜文新发的。

为此杨蔓萌也稍微补了点儿绘文集团起家的知识。

颜文新本来是CS出身,但是彼时在琹国压根儿就没有什么像样的信息技术产业,所以他靠他老婆的父亲搞了个机械加工厂(这其中怕是涉及到国有资产流失的事情),做倒卖流水线设备的生意赚了第一桶金,转而投进了房地产行业。

没想到这还因此赶上了第一波城市化的东风,绘文集团迅速膨胀了。因为房地产的铺开,绘文又接触了通信行业,进而突发奇想一般地,开始利用实体建筑的信息收集便利,做成了早期的区域性投放网站,最终形成了自媒体的雏形。因此在互联网时代来临时,绘文集团又乘着新一股东风起飞了,并且一直飞到现在。

在这其中,颜文新最初自己写出的琹字OCR起到了关键性作用。要知道绘文集团并非最早一批投入互联网的传统二产企业,但绘文的成功就在于复杂象形文字处理的优势,使得不懂外语的普通居民也能顺滑上网,再加之渠道的便利,让绘文快速占领了工薪阶层的市场。

以至于现在大部分人提起绘文集团都觉得是互联网企业,鲜少有人知道它的“主业”是房地产和机械制造。

不过这些信息对于杨蔓萌来说都没什么用处。她只需要知道一点,就是颜文新甚至近几年还在挂名发绘文集团互联网部门大数据的文章。说明至少他还是会接触点儿技术的,那杨蔓萌就不愁找人学图像识别算法了。

下班回家,吃晚饭的时候杨蔓萌跟颜夏清提了一句:“对了,最近有事儿找你爸帮忙。给我安排一下儿吧,麻烦了。”

颜夏清正在喝粥,抬眼看了看她:“什么事儿?”

“技术上的问题。我搜了一下儿,你爸是这个领域的专家。”杨蔓萌平淡地说。

这个理由很正当,颜夏清也不好说什么,只是轻咳了两声,略微压低了声音:“在他那儿我可没有发言权,你直接去找大哥吧。”

“唉。”杨蔓萌只是简单地叹了口气。



不过杨蔓萌直接找颜春茗引荐也并不麻烦——毕竟年前还帮了他查洗钱的大忙。

颜春茗接到她的电话,听到这要求时自然是很惊讶,却也没有多说什么就答应了。杨蔓萌是知道的,颜春茗虽然不清楚她和静水具体的工作性质,但对于自己集团的“保护伞”,肯定得服务好了。

星期六的上午,杨蔓萌起床吃了早饭,就带了个新的非涉密笔记本,开车去了颜文新家。

在距离门口两百多米的时候,她顺便瞟了一眼那个蘑菇房子垃圾桶里的情况。里面一个易拉罐也没有了,取而代之的是一小堆枯树叶,说明颜冬芷此时不在,而且已经离开家有段时间了。