問題已開啟 (普通問題)
關(guān)于CME20系統(tǒng)的cluster設(shè)計應(yīng)該如何下手?如何完成?一個畢業(yè)設(shè)計來的
如題吧。
提問者: ccc2tf  提問時間: 2011-12-27    
 
  我要回答:
 

  請先 登錄注冊 再回答問題

更多 CME STE 系統(tǒng) CME20 相關(guān)問題
問題答案 ( 1 )

  軟件系統(tǒng)結(jié)構(gòu)12zcv5K:JFD(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  軟件從5個方面設(shè)計基因芯片分析預(yù)測功能模塊。圖1為該軟件設(shè)計構(gòu)架。從圖1中可知軟件功能模塊包括數(shù)據(jù)的預(yù)處理、分類統(tǒng)計量、聚類分析的方法、差異基因的判斷、其他統(tǒng)計功能。我)$#@32K:JFD()$本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
fds3a21fd3sK:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有



  圖1 軟件的系統(tǒng)結(jié)構(gòu)與功能模塊#&)*(&#*K:JFD()$本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  2.2 功能模塊434321%$#K:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  (1) 數(shù)據(jù)的預(yù)處理。聚類分析的基本工作,該模塊以txt文件格式完成聚類分析數(shù)據(jù)的讀取,負責在聚類前對數(shù)據(jù)進行篩選和歸一化。mvckjlurK:JFD()$本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  (2) 分類統(tǒng)計量。該模塊中完成聚類分析前分類統(tǒng)計量的選取,包括相似系數(shù)和距離的選取,生成距離矩陣或相似系數(shù)矩陣,并保存為txt文件形式。zcv545%K:JFD()本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  (3) 聚類分析方法。該模塊實現(xiàn)各種聚類分析方法,提供了系統(tǒng)聚類分析方法、動態(tài)聚類法、自組織圖譜分析法和模糊聚類分析方法。 生成聚類結(jié)果數(shù)據(jù)、并保存為txt 文件,最后輸出聚類層次圖。揭示樣本間隱含的關(guān)系,為進一步確定具有相似表達模式的基因提供了具有相當參考價值的導(dǎo)向。12dsfds1K:JFD()$本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  (4) 差異基因的判斷。利用該功能來識別出在不同樣本中表達有差異的基因。為生物實驗尋找治病基因提供方便。
  (5) 其他統(tǒng)計功能。該模塊為分析生物實驗數(shù)據(jù)提供了一些常用的統(tǒng)計方法,如T檢驗,方差檢驗等。4321%$#(*K:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  2.3 實現(xiàn)方法與實驗結(jié)果0874*$#(*)#K:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  2.3.1 數(shù)據(jù)讀取3221aK:JFD本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  首先第一步是讀取數(shù)據(jù)文件。本軟件能讀取以制表符(tab)為界限的特定格式的文本文件(txt文件)。這種以制表符(tab)為界限的文本文件(txt文件)可以由任意標準的電子制表軟件來創(chuàng)建和輸出,如Microsoft Excel。3s1fd知1fK:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  2.3.2 數(shù)據(jù)的預(yù)處理
  數(shù)據(jù)歸一化之前,先要對數(shù)據(jù)進行篩選,由于通過圖像掃描軟件產(chǎn)生的數(shù)據(jù)中有負的數(shù)據(jù)值或者0,這主要是軟件的算法對背景噪音處理時所產(chǎn)生的。由于負數(shù)和零是不能對數(shù)化,所以過濾掉這些數(shù)據(jù)是非常必要的。忽略這些點的信息并不會對整體的分析產(chǎn)生影響,因為這些極弱的信號不足以為基因表達的差異提供證據(jù)在進行聚類分析前,必須對聚類數(shù)據(jù)進行歸一化處理。對基因芯片數(shù)據(jù)的歸一化處理,主要目的是消除由于實驗技術(shù)所導(dǎo)致地表達量(Intensity)的變化,并且使各個樣本(sample)和平行實驗的數(shù)據(jù)處于相同的水平,從而使我們可以得到具有生物學(xué)意義的基因表達量的變化。歸一化的方法根據(jù)芯片的種類、數(shù)據(jù)處理的階段和目的不同而有所差異。21fds3a2K:JFD()$本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  本軟件主要采用了針對雙熒光染色(Red and Green Chip)的cDNA 微列陣(cDNAmicroarray)的歸一化化方法。主要采用了以下幾種歸一化方法:芯片間的數(shù)據(jù)歸一化(Cross slide normalization),芯片內(nèi)的數(shù)據(jù)歸一化(within slide normalization),對數(shù)變換法。本軟件還提供了一些較常用的數(shù)據(jù)變換方法,如標準差標準化、極差標準化、極差正規(guī)化、中心化變換等。
  2.3.3 分類統(tǒng)計量4f8e342是K:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  研究變量或樣本的親疏程度的數(shù)量指標有兩種,一種叫相似系數(shù),性質(zhì)越接近的基因(樣本),它們之間的相似系數(shù)接近于1(或 -1),而彼此無關(guān)的基因(樣本),它們之間的相似系數(shù)則接近于零,在進行聚類處理時,比較相似的基因(樣本)歸為一類,不怎么相似的樣本歸為不同的類;另一種是距離,它是將每一個基因(樣本)看成m維空間(m種實驗(變量))的一個點,在這m維空間中定義距離,距離接近的點歸為同一類,距離較遠的歸于不同的類。221a3dK:JFD(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  本軟件提供這兩種數(shù)量指標。在距離尺度中:使用了歐式距離、絕對值距離、切比雪夫距離、蘭氏距離、馬氏距離和斜交空間距離等;在相似統(tǒng)計量中,使用了Pearson系數(shù)、相關(guān)系數(shù)和交角余弦等。#(么$*@#(K:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  2.3.4 聚類方法0874*$#(*K:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  基因芯片數(shù)據(jù)在經(jīng)過上述方法處理后,接下來進行聚類分析。聚類是指根據(jù)基因芯片的基因表達數(shù)據(jù),將基因按照不同的功能,或者相同的表達行為進行歸類,聚類的基因表達譜為研究人員提供基因表達差異,啟動子分析,表達模式研究等等便利的條件。
  本軟件目前提供了三種聚類方法:系統(tǒng)聚類法,動態(tài)聚類法和自組織映射聚類法。本文將主要介紹系統(tǒng)聚類法、動態(tài)聚類法和自組織映射聚類法。
  ⑴ 系統(tǒng)聚類法?0874K:JFD(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  系統(tǒng)聚類法是最早也是最普遍的應(yīng)用在基因芯片數(shù)據(jù)分析研究中的聚類算法。具體步驟如下:
  如圖2所示的那樣。每一列是不同的條件,或者在不同條件下的樣本,每一行是基因的編號,每個基因的表達量用標準化后log (R /G) 2 的表示。dsaf12zcv54K:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  ② 計算所有基因之間的分類統(tǒng)計量:通過軟件提供地分類統(tǒng)計量這一模塊來計算所有基因之間的相關(guān)系數(shù)(correlation coefficient)或距離系數(shù)。*&#%kK:JFD本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
 、 建立Gene-Gene 的距離矩陣。8e342蔏:JFD(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  ④ 建立系統(tǒng)發(fā)育樹(dendrogram):根據(jù)Gene-Gene 的距離矩陣的分值,首先找到距我)$#@3221K:JFD()$#_本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  離最近的兩個基因,然后合并,再找距離相近兩組再合并,直到所有的基因合并到一個組中。本軟件主要采用了單鏈法(single linkage method)、全鏈法(complete linkagemethod)、組平均法(average linkage method)、最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、離差平方和法。
 、 動態(tài)聚類法dsaf12zK:JFD()本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  本軟件采用了K均值聚類法和K中位值聚類法。具體算法步驟如下:2dsfds1faK:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
 、 選擇聚點。本軟件采取了用任意K個樣本或前K個樣本作為凝聚點和數(shù)值插值尋找凝聚點的方法來選取凝聚點。jouierpK:JFD()本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  ② 初始分類。本軟件采取了下面方法來進行初始分類。選擇一批聚點后,每個聚點自成一類,將樣本依次歸入其距離最近的聚點的那一類,并立即重新計算該類的重心,以代替原來的聚點,再計算下一個樣本的歸類,直至所有樣本都歸類為止。K:JFD()$#_本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
 、 自組織映射聚類(SOM)erpoej道h$#K:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  本軟件還提供了自組織映射聚類(Self-Organizing Map, SOM),是由T.Konohen 于1980年提出的模型,屬于非監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)聚類,與K-means 相似,采用SOM 聚類算法之前,也要首先估計出想要得到的類的個數(shù)。然后給每個部分建立一個隨機向量,再隨機挑選一個基因,通過已選定的距離矩形矩陣計算這一向量與表達向量之間的距離,從而確定與該基因最近的參考向量;接著調(diào)整這一參考向量使其與表達向量更相近,其他的參考向量也隨之調(diào)整。這一過程不斷迭代,參考向量的調(diào)整量減少,但相似程度的嚴格性不斷提高。最終,參考向量收斂于一個固定值,基因也隨之分為幾個部分。vmmvckjlurewK:JFD()$#_*(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
@3221a3ds也K:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
(我)$#@3221K:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
afd5a4fK:JFD()本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有

  2.3.5 數(shù)據(jù)的輸出kcvmmvckjlurK:JFD()$#_*(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  本軟件在聚類完成后,將數(shù)據(jù)保存在一個文本文件中(.txt),輸出格式如圖3。本軟件提供聚類過程中可生成距離矩陣,也是保存在文本文件中。本軟件并能輸出聚類樹狀圖(層次圖)。下面給出了系統(tǒng)聚類法和K均值聚類法的計算結(jié)果:
a3ds也K:JFD(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有

*)#$@&%#*(我K:JFD()$#_*(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
21f3dsaf12zK:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  2.3.6 差異基因的判斷d3s1fd諯:JFD()本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  在芯片陣列數(shù)據(jù)分析中另一個最常見的問題是如何在不同樣本中識別出表達有差異的基因(differentially expressed genes)。而在判斷表達差異的基因前,必須對芯片數(shù)據(jù)進行預(yù)處理。對于單張芯片,本軟件運用了Z-score值來進行分析的。利用下式來計算每條基因的Z-score值:Z = (X ? u)/σ ,其中X表示這條基因的表達比率值,u 為所有基因比例值的平均值,σ 方差為。若取Z > 2,表示基因表達比率值在平均比率加兩倍方差之外,這樣的差異表達就有統(tǒng)計學(xué)上的意義了。s4fads13東oK:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  3.實驗結(jié)果分析a4f8e342是4K:JFD()$#_*本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  實驗數(shù)據(jù)來源于Eisen博士所在的實驗室,是YeaST Saccharomyces cerevisin的基因表達數(shù)據(jù)。數(shù)據(jù)集基因數(shù)N = 6223,觀測樣本M = 40。通過DC-Cluster分析后得到的聚類結(jié)果與用Eisen博士所在實驗室提供地基因芯片數(shù)據(jù)分析軟件Cluster得到地結(jié)果比較,正確率達到90%。#$@&%#*(蜬:JFD()$#本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  4.結(jié)束語ouierpoeK:JFD()$本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有
  本文介紹了DC-CLUSTER的設(shè)計和開發(fā)過程,并對軟件各功能模塊的設(shè)計與實現(xiàn)進行了闡述。該軟件能完成基因芯片分析中聚類分析和判斷差異基因的工作,包括數(shù)據(jù)預(yù)處理、分類統(tǒng)計量的選取,系統(tǒng)聚類法、動態(tài)聚類法、判斷差異基因等功能。下一步要作地工作就是將基因芯片圖像的處理整合進來,為基因芯片圖像分析和對圖像數(shù)據(jù)的處理提供更完善的功能和更方便的操作。本軟件的開發(fā)只是在此領(lǐng)域?qū)嵺`的開始,提供更完善的功能、更方便的操作以及更準確的結(jié)果將是進一步研究與實踐的目標。oitre4K:JFD(本文來自移動通信網(wǎng)gg1fic3.cn,版權(quán)所有


回答者: Me杰     回答時間:2011-12-27 11:17    

13        10        

中國通信人才網(wǎng) | 江蘇通信人才網(wǎng) | 山東通信人才網(wǎng) | 武漢通信人才網(wǎng) | 浙江通信人才網(wǎng) | 湖南通信人才網(wǎng)
廣州銘輝網(wǎng)絡(luò)科技有限公司 聘:傳輸PTN&OTN工程師
需求人數(shù):2 人 地點:?谑,三亞市
廣東世炬網(wǎng)絡(luò)科技股份有限公司 聘:設(shè)備節(jié)電工程師
需求人數(shù):3 人 地點:昆明市
杭州東信網(wǎng)絡(luò)技術(shù)有限公司 聘:中興網(wǎng)優(yōu)工程師-遼寧大連移動
需求人數(shù):10 人 地點:大連市
浙江省郵電工程建設(shè)有限公司 聘:新疆中興中高級優(yōu)化工程師
需求人數(shù):7 人 地點:昌吉市,博樂市,克拉瑪依市,石河子市
北京電旗通訊技術(shù)股份有限公司 聘:遼寧遼陽朝陽急需電話回訪工程師
需求人數(shù):99 人 地點:遼陽市,朝陽市
嘉環(huán)科技股份有限公司 聘:核心網(wǎng)工程師-IMC青海
需求人數(shù):2 人 地點:西寧市
河南創(chuàng)賽通信科技有限公司 聘:急聘!廣西單驗簇優(yōu)化
需求人數(shù):49 人 地點:廣西省
福建省鴻官通信工程有限公司 聘:湖南電信專項中高級后臺
需求人數(shù):1 人 地點:岳陽市,益陽市
安徽引途科技有限公司 聘:安徽皖北單驗簇優(yōu)化測試
需求人數(shù):10 人 地點:六安市,宿州市,亳州市,蚌埠市,阜陽市
陜西瑞達灃通信技術(shù)有限公司 聘:華為5G工程單驗工程師
需求人數(shù):10 人 地點:吐魯番市,哈密市
熱點問題
更多精彩

聯(lián)系我們 - 問通信專家 Powered by MSCBSC 移動通信網(wǎng)  © 2006 -