真如网上所说:这个来自中国的“搜索引擎” Magi,比某度还好用?

真如网上所说:这个来自中国的“搜索引擎” Magi,比某度还好用?

杂七杂八青年君上2019-11-11 17:53:322029A+A-

“一个人在雨中哭泣,不用在意眼泪打湿了脸颊,人生苦短,难得尽情释放”


最近,一款名叫 Magi 的知识提取引擎火了。

而且大家对其评价颇高:

真如网上所说:这个来自中国的“搜索引擎” Magi,比某度还好用? 第1张

如果想看更多关于 Magi 的讨论,你可以在知乎中搜索 Magi


从表面上看, Magi 似乎应该被称为“搜索引擎”,而我认为它更适合叫做知识提取引擎。

正如官方对 Magi 的说明:这个长得很像搜索引擎的网站就是 Magi 的公众版本,但与搜索引擎不同,Magi 不仅收录互联网上的海量文本,还会去尝试理解并学习这些文本中蕴含的知识和数据。

所以,严格来说,Magi 并非全是搜索引擎,或者说搜索引擎是其副产品,理解这点很重要。

有些人错误将 Magi 定义为以新的形式(如类思维导图)或“搜索引擎中间件”来展现结果的搜索引擎,从而导致了很多误解,所以有必要区分两者的概念。


首先,我们来看看 Magi 到底是什么?

我们打开 Magi 主页:magi.com ,并搜索 癌症 关键词,如下图。

真如网上所说:这个来自中国的“搜索引擎” Magi,比某度还好用? 第2张


我们可以看到 Magi 黑色系的背景与常规的搜索引擎有明显不同,有些人可能觉得不习惯,但对于用惯了 Adobe 系列软件的我来说,感觉还挺护眼。

网页的 UI 设计精美,经过提取的结构化知识(左侧)与来源网页间通过优雅的动画线条相连。

Magi 处在不断学习之中,搜索的结果随时会变。

真如网上所说:这个来自中国的“搜索引擎” Magi,比某度还好用? 第3张

▲上下滚动图片查看更多


Magi 让人眼前一亮的是,在传统搜索结果上方,多出了一些从自然语言的网页中提取出来的“结构化知识”模块。

这种“结构化知识”既可以被机器所解析,也易于人对知识的理解和获取。

真如网上所说:这个来自中国的“搜索引擎” Magi,比某度还好用? 第4张


网上有很多恶搞的搜法,比如搜索罗永浩、来去之间、乔碧萝殿下、孙笑川、马云等关键词。

其中不乏一些让人开怀大笑的梗。

真如网上所说:这个来自中国的“搜索引擎” Magi,比某度还好用? 第5张


但是,这些都是表面的东西,我不想写太多。

反而,我更感兴趣的是 Magi 到底能给我们生活和学习带来什么改变?


知乎某账号认为:Magi 展示的内容是搜索引擎的中间结果,直接将其当做卖点。

以我的理解,传统搜索引擎在后台有一个机器能读懂的,类似 Magi 搜索结果的结构化知识库。

传统搜索引擎依据这些知识库来评判一个网页内容与搜索关键词之间的相关性。

但传统搜索引擎主要展示那些与知识库相关性较高的网页列表结果,并不会全部呈现处理信息过程中后台知识库中的内容。


Magi 直接把类似传统搜索引擎在处理信息过程中依赖的知识库作为结果展示出来。

Magi 的知识库是从纯文本自动构建,是7x24小时实时分析与处理互联网的信息,以尽量可信的知识图谱展示给用户。

Magi 不仅让知识库不断得以更新,而且能够从网页中自动提取结构化知识,并具有自动更正知识库中错误知识的能力。

所以说,它与传统搜索引擎的中间结果还是有一定区别。


另外,即使 Magi 与搜索引擎的中间结果有一定相关性,但是这并不影响它的应用场景。

Magi 更适合成为提取知识的工具,而不是搜索引擎。

比如我想到的应用场景:

1、像【得到】这样的知识服务公司,在前段时间推出了基于其发布知识产品的搜索引擎。

所以,我认为【得到】可通过这类知识提取引擎技术,将其平台上的优质资源进行整合,再以结构化数据的形式展示出来,这能极大减少用户消化知识的时间,也能让用户更深刻理解某个知识体系。

2、一些期刊网站,如知网等,包含的资源众多,传统的搜索引擎只能搜索到某篇文章,却没能将文章中的结构化知识进行提取。

据我所知,一些大学文学院的老师会给很多同学分配任务,如整理阿来的生平、著作等,将其提取出类似 Magi 给我们展示的结构化知识。

这类整理工作往往耗费大量的时间,而如有 Magi 加持的话,那工作将变得非常简单,当然,前提是 Magi 已经足够胜任复杂的论文/期刊提取工作。

诸如此类。

我们可以看到,Magi 的发展方向是对自然语言的提取,使其成为更高效的结构化知识,而不单单是搜索引擎。


magi.com 是一个公众版本,对开放领域的互联网文本进行读取,配合自家 web 搜索引擎以评估来源质量,信息源和领域并不设白名单。

只要涉及互联网,那必须要提“鱼龙混杂”这个成语。

互联网包含大量优质文章,同时也有很多滥竽充数的内容。

这对于 Magi 来说是一个严峻的挑战。


网络上充斥着大量不实信息,特别是一些由于盲目追踪热点而产生的不实文章。而这类依据大数据处理的引擎,提取了不实的信息,恐怕也会“随波逐流”吧?

比如热门事件造假,Magi 会把内部认定的可靠来源当做学习内容,筛选出可信度更高的内容,但是,对于有些事件,即使是权威的官方/媒体平台,也可能出现造谣或误传的情况。

而 Magi 对谣传信息的提取将是一种“助纣为虐”的行为。

如今的互联网四通八达,信息传递速度太快,一个热门事件的每一进展几乎实时向公众传递,这就导致有些模棱两可的信息或者猜测被公众掌握,从而产生新的猜测,而在互联网不发达的以前,一件事情基本上是铁板钉钉了,才会被公开,也就很少出现事件被多次反转的情况。

目前,Magi 的搜索的结果可作为次要参考,无法完全替代某度等搜索引擎,但未来就说不定了。

国外也有与之相似的网站,叫 Wolfram Alpha。


如果 Magi 能处理好一系列问题,将其做大,我个人预言,Magi 要么被头部互联网公司收购,要么创始人独自运营,与这些互联网巨头创造出的类似产品竞争,直到最后破产。


以上内容均遵循周恩来先生的“求同存异”方针,谢谢你能看到这里。

点击这里复制本文地址 以上内容由 青年君上 发表,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我。
qrcode

两伙青年 © All Rights Reserved.  
关于我| 桂ICP备18001158号-1 | ”” 桂公网安备 45010702001108号

请您先登录再评论!