糯米文學吧

位置:首頁 > 範文 > 職場

爬蟲崗位職責

職場2.06W

在快速變化和不斷變革的今天,很多情況下我們都會接觸到崗位職責,崗位職責的明確對於企業規範用工、避免風險是非常重要的。大家知道崗位職責的格式嗎?下面是小編收集整理的爬蟲崗位職責,歡迎大家借鑑與參考,希望對大家有所幫助。

爬蟲崗位職責

爬蟲崗位職責1

職位描述:

1、負責廣告素材線索和垂直類產品爬蟲系統的設計、開發

2、抓取資料的清洗、落地、分析

3、抓取策略演算法的.更新維護,以及確保資料抽取準確、高效

任職要求:

1、具備強悍的編碼能力、紮實的資料結構和演算法功底

2、熟悉tcp,http協議原理;熟悉ajax工作原理;精通python程式設計,熟悉一種開源爬蟲框架和原始碼;

3、有爬蟲、資訊抽取、文字分類、大資料處理相關經驗優先

4、有自然語言處理、機器學習經驗優先

爬蟲崗位職責2

職責描述:

1.參與爬蟲系統的架構設計與開發;

2.負責執行和開發分散式網路爬蟲系統,進行多平臺資訊的抓取和分析;

3.負責網頁資訊和app資料抽取、清洗、消重等工作,提升平臺的抓取效率;

4.參與爬蟲核心演算法和策略優化,熟悉採集系統的排程策略;

5.實時監控爬蟲的'進度和警報反饋。

任職要求:

1.本科以上學歷,3年以上爬蟲開發相關經驗,熟練使用python或java進行開發;

2.熟練使用正則表示式、css path、xpath等,能夠從結構化的和非結構化的資料中獲取資訊;

3.熟練使用mysql資料庫,掌握redis、mongodb、hive等常用nosql技術並具有實戰經驗;

4.熟悉各種抓取技術,包括代理、phantomjs/selenium、驗證碼處理;

5.熟悉整個爬蟲的設計及實現流程,有從事網路爬蟲、網頁資訊抽取開發經驗,熟悉反爬蟲技術,有分散式爬蟲架構經驗;

6.具有資料探勘、自然語言處理、資訊檢索、機器學習背景者優先;

7.快速學習能力,工作積極主動,有創業熱情和良好的團隊協助能力;

8.需要有大量資料爬取以及高難度反爬經驗,沒有相關經驗的勿擾。

爬蟲崗位職責3

職位描述:

工作職責:

1.開發網頁自動化指令碼。

2.負責商品資訊結構化,編寫自動化指令碼解析網頁資訊。

3.商品索引系統:億級sku的庫存價格實時跟蹤同步,並對商品進行智慧分類、本地化、圖片處理和去重。

4.設計、開發、測試、部署以及維護並改進各子系統;

5.管理專案優先順序並按時交付。

職位要求:

1.全日制統招本科、碩士畢業,1年以上軟體開發工作經驗;

2.熟悉至少一門通用靜態編譯程式語言,c/c++/java/c#/go;

3.熟悉web端基礎標準,包括html、css、javascript、json等;

4.熟悉python或其他指令碼語言,有興趣和能力根據需求學習其他程式語言;

5.熟悉unix/linux環境,memcache/redis/mongodb等儲存系統,能獨立設計開發包括前後端互動的業務子系統;

6.熟悉常見的設計模式、單元測試、持續開發整合、code review,並能在日常工作踐行;

7.瞭解搜尋引擎、電子商務、社交類應用的系統基本架構,能對已有的子系統進行優化調整的.優先;

8.活躍的開源專案貢獻者優先。

爬蟲崗位職責4

職位描述:

工作職責:

1、負責設計和開發分散式網路爬蟲系統,進行多平臺資訊的抓取和分析工作;

2、負責網頁資訊和app資料抽取、清洗、消重等工作,提升平臺的抓取效率;

3、參與爬蟲核心演算法和策略優化,熟悉採集系統的排程策略;

4、實時監控爬蟲的.進度和警報反饋。

任職要求:

1、有紮實的演算法和資料結構能力;

2、熟悉爬蟲原理,熟悉常見的反爬蟲技術,有爬蟲相關專案開發經驗者優先;

3、掌握http協議,熟悉html、dom、xpath等常見的資料抽取技術;

4、有大規模資料處理、資料探勘、資訊提取等經驗者優先。

爬蟲崗位職責5

職位描述:

負責設計和開發分散式網路爬蟲系統

應用多種技術對各平臺進行資料採集

設計資料採集策略,提升資料採集效率及質量

與各行業分析師溝通,分析專案的可行性和討論抓取方案。

兩年以上爬蟲開發相關經驗,本科及以上學歷,計算機相關專業為佳

熟練掌握c#或java開發語言為佳

瞭解tcp/ip,http及相關網路協議

熟悉js / html / xpath / json /正則表示式等網頁相關技術

熟悉分散式、多執行緒、快取、訊息佇列等網際網路技術

熟悉手機應用的資料抓取,手機app開發經驗,加/脫殼經驗為佳

良好的`溝通技能,注重細節,抗壓性強

良好的英語溝通技能為佳

爬蟲崗位職責6

崗位職責:

1.負責網路爬蟲的架構設計、開發與優化;

2.負責抓取資料的清洗、落地、分析;

3.抓取策略演算法的.更新維護,以及確保資料抽取準確、高效。

任職要求:

1.兩年及以上網際網路或軟體行業工作經驗;

2.理解http協議,熟悉html、dom、xpath;

3.熟悉linux開發環境,至少熟悉python/go/java/中的一種程式語言;

4.有爬蟲、資訊抽取、文字分類、大資料處理相關經驗優先;

5.有自然語言處理、機器學習經驗優先;

6.熟悉瀏覽器核心、渲染機制優先;

7.工作認真,細心,有條理,積極性高;良好的溝通能力及團隊合作精神。

爬蟲崗位職責7

職責描述:

1、負責公司產品的爬蟲架構設計與開發,以及爬蟲策略優化等工作;

2、根據資料產品需求,負責對網頁等大規模文字資料抓取、清洗、儲存等設計開發工作;

任職要求:

1、計算機、數學或統計等相關專業本科及以上學歷,1年以上爬蟲相關工作經驗;

2、熟悉linux平臺,熟練掌握python或java爬蟲開發工作;

3、熟悉靜態、動態網頁等大規模文字資料的'高效資訊抽取、清洗、儲存等技術;

4、有反爬相關問題處理經驗,精通常用的爬蟲技術及架構設計,並能快速開發實現;

5、具備良好的程式設計習慣和演算法基礎;

6、善於學習,熱愛技術開發,善於團隊協作,能積極主動地參與公司產品研發等相關工作。

爬蟲崗位職責8

工作內容:

1、基礎系統架構、模組、庫和元件的研發;

2、分散式海量資料儲存和分析系統的'研發和調優;

3、統計分析、報表、saas業務等系統研發;

4、crm、財務結算、工作流等內部管理系統的研發。

能力要求:

1、至少使用php/java/python等一門以上語言,開發過不算太小的專案;

2、熟悉資料結構、db、os、web開發等相關知識,對linux相關的各類技術情有獨鍾;

3、有大規模、高效能網際網路網站系統相關的設計和開發經驗者優先;

4、具備良好的學習能力和成長潛力,渴望和團隊一起快速成長。

爬蟲崗位職責9

職責描述:

1,負責網路爬蟲系統的設計與開發

2,對爬取的.網頁資訊進行資料抽取,清洗和去重等工作

任職要求:

1、2年及以上網路爬蟲開發經驗,本科及大專學歷,計算機相關專業,

2、積極、溝通順暢,工作認真負責

3、紮實的程式設計能力,熟悉常用演算法和資料結構等基礎知識

4、熟練掌握開發語言java或c/c++,熟悉指令碼語言和正則表示式

爬蟲崗位職責10

職位要求

1、計算機相關專業,本科及以上學歷,3年以上爬蟲相關工作經驗;

2、對爬蟲程式設計有強烈愛好,熟練精通掌握至少1種語言java、python,在需要的情況下能快速上手新語言切換;

3、深入理解tpc/ip、http、以及web登入認證的機制,有成功破解複雜驗證碼的經驗;

4、有通用分散式爬蟲系統架構和開發經驗,能快速部署新的爬蟲應用;

5、已有2年以上網路爬蟲或搜尋引擎工作經驗,參與過大規模資料爬蟲優先考慮;

6、有app安全、逆向等領域的經驗;

7、具有良好的'溝通、團隊協作、計劃能力,有過1—2人的團隊管理經驗。

崗位職責

1、建設完善分散式爬蟲系統;

2、建立通用的爬蟲框架,能夠快速適應新的爬蟲需求;

3、快速完成對目標資源的資料抓取、處理。

爬蟲崗位職責11

崗位職責

1.熟悉執行緒池、併發機制、鎖機制、執行緒安全原理;

體系知識:網路io、設計模式、linux、jvm、java類載入機制、java記憶體模型;

3.爬蟲經驗:webmagic、adsl撥號、正則表示式、脫殼技術、加密、圖片破解、二維碼識別、滑塊驗證碼破解、httpclient、分詞、分散式爬蟲排程、資料質量監控、代理ip排程演算法、配置化爬蟲、授權爬蟲、輿情、應用市場、反爬;

4.熟悉http/http、tcp/ip、socket等通訊協議;

5.6年以上軟體開發經驗,至少2年爬蟲開發經驗。

任職要求

1.採集、清洗、監控、配置化、排程、反爬、資料爬取、分詞、檢索等資料採集研發;

2.較強的邏輯思維和發散思維;

3.計算機或相關專業本科及以上學歷。

爬蟲崗位職責12

職位要求:

具備良好的計算機基礎,熟悉http協議,具備良好的基礎前端知識;

有過良好的'高併發系統的後臺開發經驗;

具備一定的資料處理/分析經驗,熟悉hadoop、mapreduce、spark等平行計算框架;

瞭解小程式的基礎框架,有實際開發經驗更優;

掌握c/c++、python等一門或多門語言,有nodejs開發經驗更優;

如果您還具備以下技能,我們會優先考慮:

具備網路爬蟲系統的開發經驗,有反爬蟲實踐經驗;

具備機器學習框架的開發使用經驗;

熟悉傳統搜尋引擎的seo規則。

標籤:崗位職責 爬蟲