閱讀851 返回首頁    go 火車采集器


火車采集器2011版本招募測試人員

火車采集器2011版本招募測試人員

作者:小文 發布於:2011-7-17 22:09 Sunday 分類:官方公告

火車采集器2011版的開發工作已完成一半,剩餘的開發工作也在緊張有序的進行中,軟件的功能測試將會在8月中下旬開始。現在我們開始招募軟件測試人員,對火車采集器有興趣的朋友可以考慮加入。下邊就具體的要求進行說明。

1.軟件內測不提供報酬,完全是用戶自己的興趣所在。但我們會在內測及測試完成後,給測試人員提供1個月的免費的全功能版本使用權。對於2011版本,我們會開放一個公共帳號提供給熱心用戶,以按月使用的方式,提供給用戶使用。我們會提供各種機會,讓每個用戶都可以爭取到更多的使用時間(可以累積時間)。

2.內測人員需要有豐富的火車采集器使用經驗。對於采集有深入了解的朋友,他知道火車采集器的優點,也知道它存在的不足,有自己的看法,也有自己的解決辦法。對於數據抓取,不僅是數據的抓取,在數據處理方麵有非常注重。對於申請時技術能力的考核,請用戶下載附件中的考核題目,並根據自己的看法進行回複。

3.內測人員有.net軟件開發方麵的能力更佳。2011版本的采集器會更加開放,我們會提供給用戶更多的開發接口,有獨立開發能力的朋友可以在我們軟件的平台上開發出自己的采集器來。可以利用火車采集器強大的影響力來推廣並獲得更多的收益。

4.內測完成後,測試群將長期保留,測試人員可以參加其它我公司的軟件測試及各種活動。

 

注:2011版本改動較多,內測完成後將進行公測,其他用戶也不必焦急。以下為2011版的部分特性。

1.火車采集器2011致力於采集平台的搭建,用戶可以利用平台提供的采集,發布以及其它的分詞,ocr等api,來開發適合自己的應用。

2.支持安裝為係統服務,支持httpServer,支持主從服務模式(服務端+客戶端)

3.可視化DOM樹規則編寫 xpath提取網頁數據

4.web發布時,支持json,xml等格式數據的發布.
5.自動登陸功能和登陸狀態維護,多域名登陸
6.一鍵轉載,類似於海納的一鍵轉載功能(需要采集規則支持)
7.Rss采集源自動識別
8.集成火車頭網頁正文提取模塊和通用OCR識別模塊等

9.增加mongod數據庫支持,更好支持海量數據采集

10.支持corn計劃任務,更靈活的自動運行設置

11. 更多細節改變

附件下載:
火車采集器2011版內測人員招聘流程.zip 3.89KB

標簽: 軟件內測

相關日誌:

福利來啦:6.8折優惠碼太給力!

網頁抓取工具帶你走進大數據營銷

玩轉網頁抓取工具,2016年讓大數據更接地氣!

網頁抓取工具透析大數據生態圈技術層

網頁抓取工具助力大數據基礎建設

« mdb數據庫中數據導出到word文檔小工具 | 論壇數據轉移專家Discuz!NT 3.6發布接口完成»

評論:

crsmt08
2011-07-18 14:55
想參加 是這裏報名麼?
小文
2011-07-18 15:11
@crsmt08:請下載附件並報名

發表評論:

最後更新:2017-05-09 01:05:56

  上一篇:go 帝國CMS(Empire CMS) 6.5 文章免登陸發布接口
  下一篇:go 火車采集器通用OCR識別.NET插件(03-21更新)