第32章搜索技术_我真没重生呀

“等等……”

乔海伦拦住了滔滔不绝的杨思源，皱着眉头问，“你是说，你自己发明了一种新的搜索引擎算法？”

“不是啊，”杨思源否定道，“不是一种，是好几种。”

乔海伦感觉头大，有种马上要爆炸开的感觉。

杨思源继续解释，“现在流行的搜索引擎算法，有点落后了，已经渐渐跟不上时代，满足不了实际应用的需求了。

比如原来的点歌机里用的搜索算法，本质上可以理解为在提前对信息库中的信息做好分类目录的前提下，匹配相关名称或代码。

形象一点说，就好比图书馆里找一本书，你得知道书名或者图书馆给这本书的具体编号，才能知道这本书在哪能找到。

如果找书的人信息不全，只能去大分类的图书区自己找，非常没有效率。

而未来搜索算法的趋势呢，是通过信息片段就可以精确定位，方便用户快速得到想要查找的信息。

通过一点信息片段，去匹配数据库或整个网络中所有信息，根据匹配度和信息热度提供给用户。”

杨思源只能解释到这个阶段了，像布尔模型、概率模型或者向量空间模型这些搜索模型他直接不提。

别说石磊了，乔海伦这种专业学计算机技术的，也不一定能听懂。

因为计算机技术也包含太广泛的领域了，大学教育里教授的计算机知识，也仅限于一些基础知识和某一领域的内容。

只有进步一深造或者在工作中在某个领域进行研究，才能明白这个领域的技术内涵。

更不用说这些搜索模型涉及的还有很多高深的数学知识了。

石磊和乔海伦果然一脸懵逼。

杨思源还是操作起来，用眼前的例子来具体说明。

“石经理你喜欢刘德华吧，那么咱就那刘天王为例，他上一张专辑里有首闽南风的歌叫《世界第一等》。

假设一个歌迷，他听了这首歌的旋律，觉得喜欢，到歌厅的时候要点歌了，却不知道歌名。

这首歌又是闽南语歌，歌词他也听了个大概，如果是原来的点歌机，把这首歌找出来是有点麻烦的。

但新的点歌系统可以轻松做到。”

杨思源说着在搜索栏输入“世界第一”，搜索结果很快出来，有两个结果：

《世界第一等》刘德华

《世界第一等》伍佰

“因为歌名里含世界第一的本来也不多，这首歌很容易能搜到。

换原来的方式，歌迷搜不出来，只能在刘德华的歌曲里一首一首的人工找，要耗费时间和精力，用户体验就不好了。”

“是方便了很多啊，这样一来，用户可以仅凭某个歌名中的关键词，就能轻松找到自己想唱的歌了。”

杨思源笑了，“不仅如此。你们再看。”

他从新输入，这次是输入了这首歌的一句歌词“人生的环境”，搜索结果还是一样的。

“这是通过一句歌词就把歌给找出来了？”

“对。这就是搜索算法的进步，首先肯定是匹配歌名，歌名匹配不上，它会自动从字幕文件里搜索，去匹配最接近的歌词。

然后根据歌词指向的歌名，显示出结果来。”

石磊想了一下，“那搜只搜人生二字呢？”

泡泡中文