笔趣阁>青春校园>重回九七>第七十七章 我有一个梦
字新闻,还需囊括视频新闻。我们要做的就是最迅速的新闻发布机构,没有之一,我们就要做第一,最迅速、最广泛。将目前现有的媒体都甩在我们身后

3、搜索引擎,目前的yahoo只能提供目录数据库搜索。因为yahoo的数据是手工输入的,所以不能真正被定义为搜索引擎,事实上只是一个可搜索的目录。那么在我的构想中,搜索引擎是什么样的?

搜索引擎是根据我们制定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。如何实现这个功能呢?第一步:蜘蛛一样爬行,从一个链接爬到另外一个链接,第二步:抓取存储,爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的l是完全一样的。第三步:预处理,搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理,1、提取文字2、中文分词3、去停止词4、消除噪音(搜索引擎需要识别并消除这些噪声,比如版权声明文字、导航条、广告等……)5、正向索引6、倒排索引7、链接关系计算8、特殊文件处理,我们在搜索结果中也经常会看到多种文件类型。但搜索引擎还不能处理图片、视频、flash这类非文字内容,也不能执行脚本和程序。第四步:排名,用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。针对如此大的信息量,我们怎么能做到给客户提供最便捷、最快速的服务呢?接下来的第四点,

4、数据处理,我们要在国内、国外骨干节点上建立自己的数据库,构建自己的数据存储方式,构建自己的数据搜索方式,让客户对我们的数据提供能力产生依赖。说到数据,就一定需要考虑数据的安全性,如何保证我们自己数据库的安全,如何保证我们用户电脑的数据安全,是我们为之奋斗的目标

5、电子商务,目前美国的ebay是一个号称可让全球民众上网买卖物品的线上拍卖及购物网站,但是国内有多少用户呢?我想不会超过一千人。在我的构想中,设立的电子商务网站将实现全方位、全覆盖,销售产品囊括目前市面上流通的99的商品,我的目标是建立一家全球最大的网络购物中心,击败国内所有的大型连锁购物中心,最终目标击败全球最大的连锁超市沃尔玛


状态提示:第七十七章 我有一个梦
本章阅读结束,请阅读下一章
回到顶部