字体:大 中 小
护眼
关灯
上一页
目录
下一章
第218章 编写爬虫程序 (第2/2页)
已经注册好的‘资源’双拼域名,那么你的工作就是尽可能的让行业内的人关注这个网站。”李河川说道,“我有信心,只要他们关注,必然就会被我们的数据吸引,那么下一步的注册和引导就能事半功倍了。” “我明白了。”王瑾毕竟是做过水军的,自然一下子就明白了李河川的用意。 本身她就在煤炭行业摸爬滚打了多年,手头上就有现成的资源和人脉,做宣传只需要稍加引导,外加五毛党的狂轰乱炸,肯定能让煤炭商和客户注意到这个新网站。 不过因为之前的时候签过保密协议,王瑾暂时不能直接用原来工作群来联络水军团队,不过这并不影响她用小号逐个完成和原来水军团队的对接。 看着王瑾忙的不亦乐乎,李河川也不闲着,着手开始编制爬虫程序。 对李河川的水平来说,编制这样的程序简直是太没成就感了,就好比写了几百万字的网络作家,让他去写高考作文似的,绝对水的不要不要的。 李河川唯一要做的就是把程序语言压缩,让整个爬虫程序更流畅,更荫蔽。 毕竟也有可能被某些网站的反爬虫程序给捕捉到,从而塞进来一大堆垃圾数据。 王瑾已经记录了不少的资料,而且将李河川给她的一些资料拆散打散,组成一堆看起来毫无关联的外宣文档,准备给水军下任务时使用。这些工作她驾轻就熟,而且还特意用了海外代理,以防被人追踪到。 自然,李河川也是在这样的网络环境中编写代码的。 快乐工作时,时间总是过得很快,李河川还意犹未尽时,天已经黑了。 李河川的编程进展很快,多半天的时间就完成了30%的工作量,他相信,再有一天多就能完成了。 想到这个爬虫将来可能起到的作用,李河川很恶俗的给爬虫程序起名叫“黑洞”,意思是吸取别人的东西。 李河川在编写“黑洞”之前,其实心里已经有了一套一环扣一环的商业运营计划。 获取煤炭资源领域的大数据其实只是第一步,这一步并不会产生利润,只会给他积累前期的数据,而且爬虫所爬取的网站越多,得到的数据也就越精准,这就为之后的资源交易提供了可供参考的数据。 未来,他可是准备上线交易系统的,而不是仅仅画一个指数图。 作为获取数据的利器,李河川没准备私藏,毕竟用的越多,数据越精准。 不过对于他来说,这个不会产生收益,那是因为他的重心不在这里,但对于目前处于煤炭指数权威第一序列的环渤海煤炭指数网来说,那就不一样了。 那家公司靠的是煤炭价格市场走势图来做的网站,其主要营收就是指数网上的贴片广告。 一旦让人知道,有一个新网站能够很精准的反应煤炭真实价格,而且远比它的精准,那么他的营收将会受到严重冲击。 一个连数据都不准的网站,会有人去看吗? 对李河川来说,全新的项目只有他和王瑾两个人,不可能长期维护一个爬虫程序的,更何况,李河川有着庞大的商业计划。 所以,李河川早有打算,他给自己准备了两套方案。