上海貝爾股份有限公司FTM團隊
摘要:10月22日17:05至17:12左右,某地LTE基站出現(xiàn)部分RRH瞬斷故障,RRH發(fā)生退服后自行恢復(fù)服務(wù),平均持續(xù)時間約1分鐘左右。因故障持續(xù)時間較短,且臨近下班,導(dǎo)致該故障未能及時發(fā)現(xiàn).
關(guān)鍵詞:FDD LTE; RRH瞬斷
1 故障現(xiàn)象/功能介紹
10月22日17:05至17:12左右,某地FDD LTE基站出現(xiàn)部分RRH瞬斷故障,RRH發(fā)生退服后自行恢復(fù)服務(wù),平均持續(xù)時間約1分鐘左右。因故障持續(xù)時間較短,且臨近下班,導(dǎo)致該故障未能及時發(fā)現(xiàn)。
直至第二天,接到現(xiàn)場反饋故障信息后,上海貝爾現(xiàn)場技術(shù)人員立即向公司的二線支持部門申請技術(shù)支持,同時安排人員開始故障信息的收集工作。在問題分析的過程中,從分公司到總部領(lǐng)導(dǎo)都十分重視,組織了無線技術(shù)支援中心召開電話會議,分析故障可能原因,并派研發(fā)專家趕赴現(xiàn)場。
根據(jù)統(tǒng)計分析,本次小區(qū)退服涉及基站102個,退服后的RRH中斷約1分鐘左右后繼續(xù)正常工作,經(jīng)統(tǒng)計涉及到退服的基站分散在15個BBU池內(nèi),且BBU池中,并不是所有的BBU下面下掛的RRH都出現(xiàn)退服現(xiàn)象,沒有明顯的規(guī)律,退服小區(qū)的統(tǒng)計較為分散.
2 原因分析/原理介紹
本次批量基站發(fā)生的故障,告警信息為IK4006006 – RFM COMM FAIL,該告警表示基站控制板eCCM在連續(xù)30秒的時間內(nèi)沒有收到RRH的心跳信號,就會認為RRH已經(jīng)退出了服務(wù),并產(chǎn)生IK4006006告警。根據(jù)告警信息和現(xiàn)場工程師收集了相關(guān)log信息,研發(fā)部門進行了分析,我們認為外部因素也可能引發(fā)故障的發(fā)生,故需要尋找并檢查網(wǎng)絡(luò)拓撲中的相關(guān)節(jié)點,是否能夠發(fā)現(xiàn)一些線索,如傳輸光路出現(xiàn)誤碼、瞬斷等都可能引起心跳丟失。同時,我們也不排除產(chǎn)品自身問題的可能性。因此我們從產(chǎn)品自身和外部環(huán)境兩個方面同時著手進行了深入仔細的排查。
在接到故障信息后,上海貝爾現(xiàn)場技術(shù)人員在第一時間收集了日志文件,并提交上級技術(shù)支持和研發(fā)人員分析。下面我們將從uptime、日志文件,軟件版本,產(chǎn)品批次這四個方面進行分析:
.........篇幅有限,更多精彩請關(guān)注下方
FDD-LTE--LTE基站出現(xiàn)RRH瞬斷故障案例分析.pdf
感謝分享
(勾選中文件為要刪除文件)
您即將訪問的地址是其它網(wǎng)站的內(nèi)容,MSCBSC將不再對其安全性和可靠性負責(zé),請自行判斷是否繼續(xù)前往
繼續(xù)訪問 取消訪問,關(guān)閉