<ol id="zbj5z"></ol>
      <dl id="zbj5z"></dl><noframes id="zbj5z"><del id="zbj5z"><i id="zbj5z"></i></del>

          
          
          <output id="zbj5z"><ruby id="zbj5z"><var id="zbj5z"></var></ruby></output>
              <output id="zbj5z"><strike id="zbj5z"><mark id="zbj5z"></mark></strike></output>

                  杭州IT培訓
                  美國上市IT培訓機構

                  13175137725

                  大數據開發與一般Java開發有什么區別

                  • 時間:2019-08-07 16:09
                  • 發布:轉載
                  • 來源:網絡

                  本文為大家簡單介紹一下什么是大數據開發工程師,當前互聯網公司的數據開發到底是什么樣子的?和一般的Java或者PHP工程師在工作上有什么區別?一起來看看吧。

                  什么不是大數據開發?

                      

                  • 僅使用數據庫(關系型mysql,sqlserver,oracle等 非關系型 mongo redis等),盡管數據量達到千萬級別,億級別不是大數據開發。

                  • 從業務系統的數據庫中查詢數據然后產出報表不是大數據開。

                  • 端上(頁面,h5,手機native)埋點上報數據記錄到數據庫中不是大數據開發。


                  什么是大數據開發
                  1. 大數據開發需要的技能

                  現在互聯網公司所指的大數據開發用到的工具是:hadoop,hive,hbase,spark,kafka等。

                  2. 大數據開發做的事情
                  • 精簡到一個詞語就是:統計

                  • 精簡到兩類指標就是:PV和UV

                  • 精簡到一句話就是:統計各種指標的PV和UV

                  PC互聯網時代,各門戶網站(比如:新浪,網易,搜狐)關注的是各自網站今天被打開了幾次(pv),今天有多少人(uv)訪問了網站。更復雜一點的比如:

                  • 頁面上某個按鈕或者某個連接有多少人點擊了幾次

                  • 某個頁面上的熱力圖(點擊地方越多,圖上顏色越重)

                  移動互聯網時代,手機應用被用戶打開的次數和人數也是大家關注的重點,但是除此之外還多出了許多其他非常重要的數據,由于手機屏幕的限制,信息流成為了移動時代的主流。


                  各大門戶網站非常關注自己的新聞客戶端中:在信息流中曝光了多少篇文章,其中有多少篇文章被用戶點擊了。每篇文章閱讀了長時間,因為用戶點擊的文章越多,使用客戶端的時間越長,各公司的廣告收入才越高,所以各公司想方設法推薦用戶喜歡的內容。

                  3. 如何做這些事情

                  因為網站的瀏覽行為,手機客戶端中文章的曝光或者點擊這些數據非常大,基本以億為單位起。所以傳統的把統計信息放到數據庫中的方式已經不能完成這項統計工作。(例如:wordpress博客中,用戶每閱讀一篇文章,mysql中就會更新這篇文章的閱讀次數+1)

                  所以大數據是通過日志來統計這些指標。

                  比如:后臺服務的日志(apache,tomcat,weblogic,nginx日志)

                  主要難點在于:

                  • 日志量太大(一般大點的互聯網公司,一個業務線每天的日志都有幾個t,再大些的每天幾十t,幾百t也不奇怪),需要掌握大數據相關技術例如前面提到的hadoop,hive等。

                  • 數據的及時性,從離線計算來說,一般每天零點,前一天的日志都接收完畢,開始計算前一天的數據,幾點能計算完畢?要看各個公司各自的要求。

                  • 數據的準確性。(這是重中之重,大數據開發的工作就是統計,統計的數據如果不準....)

                  • 如果是實時計算,需要掌握實時相關技術。例如:每5分鐘網站的在線人數。

                  • 監控監控監控:監控任務是否失敗,數據是否產出,產出的數據是否異常。

                  • 容災容災容災:如果任務失敗如何補救。比如實時任務,由于某種原因13:00到14:00的數據沒有,如何把數據補回來。

                  大數據開發和一般開發對比

                  在轉做大數據開發之前,一直在用Java作業務系統:例如hr系統(考勤,薪資等),收費系統。


                  談談我個人對業務系統開發和大數據開發的理解:

                  業務系統:

                  一句話:對數據庫的各種增刪改查操作。

                  重點難點在于:

                  • 對復雜業務的理解上(比如計算工資:基本工資,五險一金,全勤獎,高溫補貼,報銷,獎金,加班費.....等等都需要計算)。

                  • 線上服務的穩定,比如facebook,淘寶等網站高并發的壓力下維持網站正常運行。

                  大數據開發


                  一句話:對字符串的各種算數。


                  重難點在于:

                  • 數據的及時性。例如實時數據中,想知道 12:00~12:10這10分鐘的用戶數,如果這個數據在晚上20點才計算完成,那就沒什么意義了。再比如,大家應該都有體驗過:再手機上刷新聞的時候,你點了某一篇文章,再繼續刷新聞,后面很快會出來不少和前面點擊的那篇文章類似的文章,這就是根據你的點擊給你及時推薦你有更大可能點的東西。

                  • 數據的準確性。這個重要性不言而喻

                  • 數據的穩定性和容災。

                  如果你也想入行大數據行業,歡迎來到杭州達內了解更多內容哦。

                  預約申請免費試聽課

                  怕錢不夠?就業掙錢后再付學費!    怕學不會?從入學起,達內定制課程!     擔心就業?達內多家實踐企業供你挑選 !

                  上一篇:轉行必看:互聯網都有哪些具體崗位?
                  下一篇:Java憑什么能持續領先編程界?

                  這5個常見的編程語言到底用來做什么的?

                  java開發中的StringBuilder區別是什么?

                  入門必知:Java有什么特點和特質

                  大數據開發與一般Java開發有什么區別

                  • 掃碼領取資料

                    回復關鍵字:視頻資料

                    免費領取 達內課程視頻學習資料

                  • 視頻學習QQ群

                    添加QQ群:1143617948

                    免費領取達內課程視頻學習資料

                  Copyright ? 2021 Tedu.cn All Rights Reserved 京ICP備08000853號-56 京公網安備 11010802029508號 達內時代科技集團有限公司 版權所有

                  選擇城市和中心
                  江西省

                  貴州省

                  廣西省

                  海南省

                  亚洲 日韩 国产 有码,性爱网,香蕉视频app下载,三级黄色,任你躁在线精品免费,影音先锋最新年资源站,亚洲另类欧美小说图片区