天才一秒记住【长江书屋】地址:https://www.cjshuwu.com
做这个业务,吃力不讨好,现在电信没开放让普通用户直接上网的业务,都已经赢麻了。
等将来电信直接开放端口,把赚差价的中间商一脚踢开,那真是为谁辛苦为谁忙,毫无意义。
“不如我们做搜索引擎吧,我连钱教授注册的域名都记不住,现在才几个网站,等将来网站多了,更记不住了。”
技术总监觉得安夏说的有道理,在他心中,搜索引擎就是个查号台,用的人可能不多,不过还是得有。
如果他知道后世有人在百度上搜索谷歌,不知道会不会大跌眼镜。
当技术一开始研发,他就发现了问题。
搜索引擎的技术含量比早期的ftp文件搜索器要高许多。
首先要打通的难关是用什么方法才能找到拥有对应字符的网页。
现在国外域名已经有很多,散落在互联网的世界中,总不能要他们像登记黄页一样,一个一个的上报吧……
技术总监用力抓了抓日渐稀少的头发。
听到汇报之后,安夏心想:难道现在还没有爬虫技术?
嗯……应该有办法解决的。
怎么解决来着……我是一产品经理,没干过这事啊……
安夏在自己仅存的技术记忆中搜寻相关知识,唉,让他们先试试吧,实在不行,就去麻省理工,把爬虫发明者抓来。
“你们先试试选一些网页,把链
接地址作为种子url,把它们放进待抓取的队列中,做个程序,读取这些url,然后再通过dns,哦,就是域名系统解析,可以转换成网络服务器对应的ip地址。
然后下载对应页面,就可以抓取网页上的相关数据了……大概是这样的原理。”
“哦~~~~~~~原来如此!
!”
技术总监恍然大悟。
然后他高高兴兴地走了。
安夏困惑地看着他离开的背影。
什么?
他懂了?
他懂什么了?
我也是先看过爬虫,才能记住这么长的东西……
他居然已经“原来如此”
了???
算了……不跟有天赋的人计较,他们都不是人!
安夏放弃纠结,安安心心地冲了一杯咖啡,看她的股市信息了。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!