千尋CORS如何做到“每秒服務百萬用戶”
千尋CORS特別“穩(wěn)”,用過的人都知道。撐起千尋服務穩(wěn)定性的,是一項名為“高并發(fā)”的技術能力。
什么是“高并發(fā)”?“高并發(fā)”是指大量用戶(終端)的快速接入。對于網(wǎng)絡平臺而言,如果不具備良好的高并發(fā)處理能力,輕則引發(fā)服務中斷,重則引起服務器宕機。
2021年 ,千尋位置高精度位置服務平臺的高并發(fā)能力已經(jīng)達到了每秒百萬級,也就是說每秒鐘能夠為超過百萬級的用戶來同時提供高精度定位的服務。
這不僅是行業(yè)里面的冠軍,對標整個互聯(lián)網(wǎng)也是一個高水平能力。這是如何做到的呢?下面小編將從系統(tǒng)能力、運維能力兩個層面,分析其中的技術要點。
系統(tǒng)能力|水平擴展基于分布式服務架構(gòu)設計的千尋位置高精度位置服務平臺,具有“海量用戶”的服務擴展能力,增加服務器就可以服務更多用戶。在具體的實現(xiàn)路徑上,主要分為4步:第一步:自研SpaceX 高性能分布式框架千尋位置的服務具有覆蓋廣、規(guī)模大、實時性要求高等特點,需要千尋位置高精度位置服務平臺以高度的靈活性,實現(xiàn)效率最大化。針對這樣的情況,2015開始,千尋位置自主研發(fā)了內(nèi)部代號為SpaceX的高性能分布式應用框架。
SpaceX框架:可以將一個龐大的計算任務劃分為若干個小任務,并分配給每臺計算機。計算機集群通過并行處理提高了效率,在統(tǒng)一管理控制下,完成大規(guī)模信息處理任務。國家北斗地基增強系統(tǒng)“全國一張網(wǎng)”的解算,就是通過SpaceX框架,分成幾千個小網(wǎng)任務,分布在上百臺機器同時進行解算。
第二步:快速復制數(shù)據(jù)的擴展塢程序Switch千尋位置針對快速復制國家北斗地基增強系統(tǒng)“全國一張網(wǎng)”能力,研發(fā)了一個擴展塢程序,它被命名為Switch。Switch將算法產(chǎn)生的網(wǎng)格數(shù)據(jù)復制多份,再將復制的數(shù)據(jù)分發(fā)給下游用戶。
第三步:提高效率,集中處理為提升處理性能,千尋位置高精度位置服務平臺中熱點識別應用會將用戶分布較多的區(qū)域識別出來,將相同地區(qū)用戶集中到一塊處理,大大提升性能,降低服務器壓力,達到降本增效效果。
第四步:用戶均勻分布,降低平均排隊時間用戶連接服務時,千尋位置高精度位置服務平臺會有專門的負載均衡SLB應用來指導用戶應該去哪個服務器處理。這樣每個服務器的壓力均衡,用戶平均等待時間就降低了。
系統(tǒng)能力|服務高可用千尋位置高精度位置服務平臺除了要去支撐用戶,還要保證服務的高可用。千尋位置做了多套服務冗余備份,在數(shù)據(jù)中心之下分為6個可用區(qū)和3個隔離集群。
6個可用區(qū),主要就是防止單機房故障,可用區(qū)的概念有點像當?shù)氐臋C房;·3個隔離區(qū)群,是按照千尋位置的業(yè)務群體進行劃分的。由于不同行業(yè)(智能電子設備、汽車、測繪RTK)對于高精度位置服務的要求和標準不同,隔離區(qū)群能夠做到互補干擾。
系統(tǒng)能力|自我保護千尋位置高精度位置服務平臺在流量突增的時候擁有自我保護機制,主要是精準流控和熔斷機制。
一、精準流控有6種影響因素,主要包括算法A/B群灰度、鏈路規(guī)則、用戶應用、產(chǎn)品、區(qū)域、百分比,按照這6種因素不同的排列組合,可以形成適合不同用戶的策略。比如有一種策略,只適合廣東地區(qū)電力,那有這種路線規(guī)劃的話就可以把這個服務精準的去推到這個客戶上面。
二、熔斷機制的建設。千尋位置的服務其實是有容量的,比如說現(xiàn)在容量是1億,那突然來了2億流量,千尋位置的高精度位置服務平臺能去做到一個自我保護,優(yōu)先保證服務好前1億用戶。隨著服務器擴展,逐漸去支持到后來涌入的2億流量。
運維能力|快速診斷基于系統(tǒng)可視化和智能化定位能力,千尋位置高精度位置服務平臺可以進行問題的快速定位。
系統(tǒng)可視化能力由業(yè)務監(jiān)控大屏、應用處理能力監(jiān)控大屏、云資源服務狀態(tài)監(jiān)控大屏組成。從這三個維度,系統(tǒng)就完完全全變成一個透明化。
業(yè)務監(jiān)控大屏實時呈現(xiàn)用戶在線數(shù)量、整體分布、定位狀態(tài)、特定用戶群體以及在線的工具(測距、定位、回放);· 應用處理能力監(jiān)控大屏核心呈現(xiàn)用戶實時連接數(shù)、每秒新增連接數(shù)、每秒下線連接數(shù);·云資源服務狀態(tài)監(jiān)控則能查看CPU使用情況、內(nèi)存使用情況、TCP網(wǎng)絡連接狀態(tài)等。
智能化定位能力由系統(tǒng)控制臺、網(wǎng)格異常分析、基站異常分析構(gòu)成,能夠主動判斷用戶服務是否正常、問題是否由基站引起以及是否由周邊環(huán)境影響。
運維能力|快速恢復千尋位置高精度位置平臺具有從問題中快速恢復的能力,在實施層面分為快速響應 、記錄通知、啟動預案 、 工具化處理4個步驟。
首先,千尋位置設置了7*24小時值守的應用監(jiān)控室,第一時間響應問題;其次,千尋位置應急響應平臺記錄事件,并通過電話、軟件系統(tǒng)通知相關運維、開發(fā)等處理人員;再次,日常處理預案留有記錄,運維人員結(jié)合系統(tǒng)流程 + 工具,自動化操作減少失誤,達到快速恢復的能力;最后,將日常標準流程歸納提煉之后,都升級為工具化執(zhí)行,不需要人工干預,在提高效率的同時,也避免了因人為導致的不可控因素。
運維能力|故障演練混沌工程是在分布式系統(tǒng)上進行實驗的學科。模擬功能性測試、性能測試、極端場景測試,通過長時間測試,發(fā)現(xiàn)系統(tǒng)以常規(guī)測試手段難以模擬和測試的BUG。
混沌工程主要解決極端的情況,比如說網(wǎng)絡中斷、服務器宕機等,它通過長時間測試,頻繁的去驗證,訓練出系統(tǒng)級的反應能力并加以鞏固,在真正遇到問題的時候給予反應。
更多相關
海洋調(diào)查如何才能產(chǎn)生高質(zhì)量數(shù)據(jù)
“我們往往只聞眾多調(diào)查項目轟轟烈烈地啟動,調(diào)查船奔赴各大洋考察繼而凱旋,鮮有人關心取得了多長時序的有效調(diào)查數(shù)據(jù),質(zhì)量又如何?!眹液Q缶值诙Q笱芯克淌诩壐吖ぴS建平14日在接受記者采訪時發(fā)問,“...
千尋見微FindMM常見問題一覽,沒有比這個更全面的了!
千尋見微FindMM是千尋位置推出的一款云端后處理GNSS高精度定位產(chǎn)品,主要應用于變形監(jiān)測領域,包括邊坡監(jiān)測、礦山監(jiān)測、鐵塔監(jiān)測、房屋監(jiān)測、大壩橋梁監(jiān)測、區(qū)域性沉降監(jiān)測等?! ∮脩糁恍枰唵闻渲?..
國測地形一隊為引漢濟渭工程提供測繪保障服務紀實
引漢濟渭工程地跨黃河、長江兩大流域,橫越秦嶺屏障,由漢江向渭河調(diào)水,總調(diào)水規(guī)模達15億立方米,工程主要由黃金峽水利樞紐、秦嶺輸水隧洞和三河口水利樞紐三大部分組成。國家測繪地理信息局第一地形測量隊充...
快速響應開展昌都市江達縣山體滑坡應急測繪保障工作
10月11日7:00,金沙江流經(jīng)的川藏交界處西藏昌都市江達縣波羅鄉(xiāng)寧巴村發(fā)生山體滑坡,造成斷流,形成堰塞湖,危及人民群眾生命財產(chǎn)安全。按照自然資源部關于盡快獲取地質(zhì)災害區(qū)域影像的部署要求,四川測繪...
徠卡RTC360三維激光掃描儀在地籍測量中的應用
地籍圖測繪是不動產(chǎn)調(diào)查的一項重要內(nèi)容。常規(guī)的地籍測量由于工作繁瑣,需要招聘大量的技術人員,采用手持測距儀、全站儀、RTK等作業(yè)方式進行。普遍存在時間緊重、任務重、人員不足、數(shù)據(jù)獲取困難的問題?! ?..
賽維板報丨GNSS 定位的基本原理
GNSS定位原理GNSS衛(wèi)星定位,實際上就是將分布在天空的高軌衛(wèi)星當做已知點,根據(jù)GNSS系統(tǒng)的組成原理可知,每顆GNSS衛(wèi)星瞬間位置都可以計算出來,并且通過衛(wèi)星信號發(fā)送到地面GNSS接...
專業(yè)測量設備千尋星矩SR1RTK:在各種測量場景中表現(xiàn)如何?
千尋自主RTK設備:“星矩SR1”已經(jīng)正式上線,作為一款專業(yè)的高精度GNSS接收機,千尋星矩SR1支持北斗、GPS、GLONASS、GALILEO四大衛(wèi)星系統(tǒng),可以被用于對測量精度要求較高的地圖測...
徠卡TZ全站儀在電力行業(yè)導線弧垂測量中的應用
項目背景: 廣西自治區(qū)某縣繞城公路工程建設,線路橋梁跨越高壓輸電線路,當?shù)毓╇娋中铚y算輸電導線與橋面的安全距離,需觀測在當前溫度下輸電導線弧垂,計算該導線的最大弧垂,評估橋面預留的安全距離是否滿...