“等等……”
乔海伦拦住了滔滔不绝的杨思源,皱着眉头问,“你是说,你自己发明了一种新的搜索引擎算法?”
“不是啊,”杨思源否定道,“不是一种,是好几种。”
乔海伦感觉头大,有种马上要爆炸开的感觉。
杨思源继续解释,“现在流行的搜索引擎算法,有点落后了,已经渐渐跟不上时代,满足不了实际应用的需求了。
比如原来的点歌机里用的搜索算法,本质上可以理解为在提前对信息库中的信息做好分类目录的前提下,匹配相关名称或代码。
形象一点说,就好比图书馆里找一本书,你得知道书名或者图书馆给这本书的具体编号,才能知道这本书在哪能找到。
如果找书的人信息不全,只能去大分类的图书区自己找,非常没有效率。
而未来搜索算法的趋势呢,是通过信息片段就可以精确定位,方便用户快速得到想要查找的信息。
通过一点信息片段,去匹配数据库或整个网络中所有信息,根据匹配度和信息热度提供给用户。”
杨思源只能解释到这个阶段了,像布尔模型、概率模型或者向量空间模型这些搜索模型他直接不提。
别说石磊了,乔海伦这种专业学计算机技术的,也不一定能听懂。
因为计算机技术也包含太广泛的领域了,大学教育里教授的计算机知识,也仅限于一些基础知识和某一领域的内容。
只有进步一深造或者在工作中在某个领域进行研究,才能明白这个领域的技术内涵。
更不用说这些搜索模型涉及的还有很多高深的数学知识了。
石磊和乔海伦果然一脸懵逼。
杨思源还是操作起来,用眼前的例子来具体说明。
“石经理你喜欢刘德华吧,那么咱就那刘天王为例,他上一张专辑里有首闽南风的歌叫《世界第一等》。
假设一个歌迷,他听了这首歌的旋律,觉得喜欢,到歌厅的时候要点歌了,却不知道歌名。
这首歌又是闽南语歌,歌词他也听了个大概,如果是原来的点歌机,把这首歌找出来是有点麻烦的。
但新的点歌系统可以轻松做到。”
杨思源说着在搜索栏输入“世界第一”,搜索结果很快出来,有两个结果:
《世界第一等》刘德华
《世界第一等》伍佰
“因为歌名里含世界第一的本来也不多,这首歌很容易能搜到。
换原来的方式,歌迷搜不出来,只能在刘德华的歌曲里一首一首的人工找,要耗费时间和精力,用户体验就不好了。”
“是方便了很多啊,这样一来,用户可以仅凭某个歌名中的关键词,就能轻松找到自己想唱的歌了。”
杨思源笑了,“不仅如此。你们再看。”
他从新输入,这次是输入了这首歌的一句歌词“人生的环境”,搜索结果还是一样的。
“这是通过一句歌词就把歌给找出来了?”
“对。这就是搜索算法的进步,首先肯定是匹配歌名,歌名匹配不上,它会自动从字幕文件里搜索,去匹配最接近的歌词。
然后根据歌词指向的歌名,显示出结果来。”
石磊想了一下,“那搜只搜人生二字呢?”