真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁(yè) 精品范文 生物信息學(xué)

生物信息學(xué)

時(shí)間:2023-05-29 18:03:03

開(kāi)篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇生物信息學(xué),希望這些內(nèi)容能成為您創(chuàng)作過(guò)程中的良師益友,陪伴您不斷探索和進(jìn)步。

第1篇

關(guān)鍵詞:推薦系統(tǒng);生物信息學(xué)

推薦系統(tǒng)(RecommenderSystem)[1]是個(gè)性化信息服務(wù)的主要技術(shù)之一,它實(shí)現(xiàn)的是“信息找人,按需服務(wù)”;通過(guò)對(duì)用戶信息需要、興趣愛(ài)好和訪問(wèn)歷史等的收集分析,建立用戶模型,并將用戶模型應(yīng)用于網(wǎng)上信息的過(guò)濾和排序,從而為用戶提供感興趣的資源和信息。生物信息學(xué)(Bioinformatics)[2,3]是由生物學(xué)、應(yīng)用數(shù)學(xué)和計(jì)算機(jī)科學(xué)相互交叉所形成的一門新型學(xué)科;其實(shí)質(zhì)是利用信息科學(xué)的方法和技術(shù)來(lái)解決生物學(xué)問(wèn)題。20世紀(jì)末生物信息學(xué)迅速發(fā)展,在信息的數(shù)量和質(zhì)量上都極大地豐富了生物科學(xué)的數(shù)據(jù)資源,而數(shù)據(jù)資源的急劇膨脹需要尋求一種科學(xué)而有力的工具來(lái)組織它們,基于生物信息學(xué)的二次數(shù)據(jù)庫(kù)[4]能比較好地規(guī)范生物數(shù)據(jù)的分類與組織,但是用戶無(wú)法從大量的生物數(shù)據(jù)中尋求自己感興趣的部分(著名的生物信息學(xué)網(wǎng)站NCBI(美國(guó)國(guó)立生物技術(shù)信息中心),僅僅是小孢子蟲(Microsporidia)的DNA序列就達(dá)3399種),因此在生物二次數(shù)據(jù)庫(kù)上建立個(gè)性化推薦系統(tǒng),能使用戶快速找到自己感興趣的生物信息。特別是在當(dāng)前生物信息數(shù)據(jù)量急劇增長(zhǎng)的情況下,生物信息學(xué)推薦系統(tǒng)將發(fā)揮強(qiáng)大的優(yōu)勢(shì)。

1推薦系統(tǒng)的工作流程

應(yīng)用在不同領(lǐng)域的推薦系統(tǒng),其體系結(jié)構(gòu)也不完全相同。一般而言,推薦系統(tǒng)的工作流程[5]如圖1所示。

(1)信息獲取。推薦系統(tǒng)工作的基礎(chǔ)是用戶信息。用戶信息包括用戶輸入的關(guān)鍵詞、項(xiàng)目的有關(guān)屬性、用戶對(duì)項(xiàng)目的文本評(píng)價(jià)或等級(jí)評(píng)價(jià)及用戶的行為特征等,所有這些信息均可以作為形成推薦的依據(jù)。信息獲取有兩種類型[6],即顯式獲取(Explicit)和隱式獲取(Implicit),由于用戶的很多行為都能暗示用戶的喜好,因此隱式獲取信息的準(zhǔn)確性比顯式高一些。

(2)信息處理。信息獲取階段所獲得的用戶信息,一般根據(jù)推薦技術(shù)的不同對(duì)信息進(jìn)行相應(yīng)的處理。用戶信息的存儲(chǔ)格式中用得最多的是基于數(shù)值的矩陣格式,最常用的是用m×n維的用戶—項(xiàng)目矩陣R來(lái)表示,矩陣中的每個(gè)元素Rij=第i個(gè)用戶對(duì)第j個(gè)項(xiàng)目的評(píng)價(jià),可以當(dāng)做數(shù)值處理,矩陣R被稱為用戶—項(xiàng)目矩陣。

(3)個(gè)性化推薦。根據(jù)形成推薦的方法的不同可以分為三種,即基于規(guī)則的系統(tǒng)、基于內(nèi)容過(guò)濾的系統(tǒng)和協(xié)同過(guò)濾系統(tǒng)。基于規(guī)則的推薦系統(tǒng)和基于內(nèi)容過(guò)濾的推薦系統(tǒng)均只能為用戶推薦過(guò)去喜歡的項(xiàng)目和相似的項(xiàng)目,并不能推薦用戶潛在感興趣的項(xiàng)目。而協(xié)同過(guò)濾系統(tǒng)能推薦出用戶近鄰所喜歡的項(xiàng)目,通過(guò)用戶與近鄰之間的“交流”,發(fā)現(xiàn)用戶潛在的興趣。因此本文所用的算法是基于協(xié)同過(guò)濾的推薦算法。

(4)推薦結(jié)果。顯示的任務(wù)是把推薦算法生成的推薦顯示給用戶,完成對(duì)用戶的推薦。目前最常用的推薦可視化方法是Top-N列表[7],按照從大到小順序把推薦分值最高的N個(gè)事物或者最權(quán)威的N條評(píng)價(jià)以列表的形式顯示給用戶。

2生物信息學(xué)推薦系統(tǒng)的設(shè)計(jì)

綜合各種推薦技術(shù)的性能與優(yōu)缺點(diǎn),本文構(gòu)造的生物信息學(xué)推薦系統(tǒng)的總體結(jié)構(gòu)如圖2所示。

生物信息學(xué)推薦系統(tǒng)實(shí)現(xiàn)的主要功能是在用戶登錄生物信息學(xué)網(wǎng)站時(shí),所留下的登錄信息通過(guò)網(wǎng)站傳遞到推薦算法部分;推薦算法根據(jù)該用戶的用戶名從數(shù)據(jù)庫(kù)提取出推薦列表,并返回到網(wǎng)站的用戶界面;用戶訪問(wèn)的記錄返回到數(shù)據(jù)庫(kù),系統(tǒng)定時(shí)調(diào)用推薦算法,對(duì)數(shù)據(jù)庫(kù)中用戶訪問(wèn)信息的數(shù)據(jù)進(jìn)行分析計(jì)算,形成推薦列表。

本系統(tǒng)采用基于近鄰的協(xié)同過(guò)濾推薦算法,其結(jié)構(gòu)可以進(jìn)一步細(xì)化為如圖3所示。算法分為鄰居形成和推薦形成兩大部分,兩部分可以獨(dú)立進(jìn)行。這是該推薦系統(tǒng)有別于其他系統(tǒng)的優(yōu)勢(shì)之一。由于信息獲取后的用戶—項(xiàng)目矩陣維數(shù)較大,使得系統(tǒng)的可擴(kuò)展性降低。本系統(tǒng)采用SVD矩陣降維方法,減少用戶—項(xiàng)目矩陣的維數(shù),在計(jì)算用戶相似度時(shí)大大降低了運(yùn)算的次數(shù),提高了推薦算法的效率。

(1)信息獲取。用戶對(duì)項(xiàng)目的評(píng)價(jià)是基于用戶對(duì)某一個(gè)項(xiàng)目(為表示簡(jiǎn)單,以下提及的項(xiàng)目均指網(wǎng)站上的生物物種)的點(diǎn)擊次數(shù)來(lái)衡量的。當(dāng)一個(gè)用戶注冊(cè)并填寫好個(gè)人情況以后,系統(tǒng)會(huì)自動(dòng)為該用戶創(chuàng)建一個(gè)“信息矩陣”,該矩陣保存了所有項(xiàng)目的ID號(hào)以及相應(yīng)的用戶評(píng)價(jià),保存的格式為:S+編號(hào)+用戶評(píng)價(jià),S用于標(biāo)記項(xiàng)目,每個(gè)項(xiàng)目編號(hào)及其評(píng)價(jià)都以“S”相隔開(kāi);編號(hào)是唯一的,占5位;用戶評(píng)價(jià)是用戶點(diǎn)擊該項(xiàng)目的次數(shù),規(guī)定其范圍是0~100,系統(tǒng)設(shè)定當(dāng)增加到100時(shí)不再變化。這樣做可防止形成矩陣時(shí)矩陣評(píng)價(jià)相差值過(guò)大而使推薦結(jié)果不準(zhǔn)確。(2)信息處理。信息處理是將所有用戶的信息矩陣轉(zhuǎn)換為用戶—項(xiàng)目矩陣,使用戶信息矩陣數(shù)值化,假設(shè)系統(tǒng)中有M個(gè)用戶和N個(gè)項(xiàng)目,信息處理的目的就是創(chuàng)建一個(gè)M×N的矩陣R,R[I][J]代表用戶I對(duì)項(xiàng)目J的評(píng)價(jià)。

(3)矩陣處理。協(xié)同過(guò)濾技術(shù)的用戶—項(xiàng)目矩陣的數(shù)據(jù)表述方法所帶來(lái)的稀疏性嚴(yán)重制約了推薦效果,而且在系統(tǒng)較大的情況下,它既不能精確地產(chǎn)生推薦集,又忽視了數(shù)據(jù)之間潛在的關(guān)系,發(fā)現(xiàn)不了用戶潛在的興趣,而且龐大的矩陣增加了計(jì)算的復(fù)雜度,因此有必要對(duì)該矩陣的表述方式做優(yōu)化,進(jìn)行矩陣處理。維數(shù)簡(jiǎn)化是一種較好的方法,本文提出的算法應(yīng)用單值分解(SingularValueDecomposition,SVD)技術(shù)[8],對(duì)用戶—項(xiàng)目矩陣進(jìn)行維數(shù)簡(jiǎn)化。

(4)相似度計(jì)算。得到降維以后的用戶矩陣US,就可以尋找每個(gè)用戶的近鄰。近鄰的確定是通過(guò)兩個(gè)用戶的相似度來(lái)度量的。本文采用Pearson相關(guān)度因子[9]求相似度。(5)計(jì)算用戶鄰居。該方法有兩種[10],即基于中心的鄰居(Center-BasedNeighbor)和集合鄰居(AggregateNeighbor)。本系統(tǒng)采用了第一種方法,直接找出與用戶相似度最高的前N個(gè)用戶作為鄰居,鄰居個(gè)數(shù)N由系統(tǒng)設(shè)定,比如規(guī)定N=5。

(6)推薦形成。推薦形成的前提是把當(dāng)前用戶的鄰居ID號(hào)及其與當(dāng)前用戶的相似度保存到數(shù)據(jù)庫(kù)中,而在前面的工作中已找出各用戶的鄰居以及與用戶的相似度,推薦形成部分只需要對(duì)當(dāng)前登錄用戶進(jìn)行計(jì)算。推薦策略是:對(duì)當(dāng)前用戶已經(jīng)訪問(wèn)過(guò)的項(xiàng)目不再進(jìn)行推薦,推薦的范圍是用戶沒(méi)有訪問(wèn)的項(xiàng)目,其目的是推薦用戶潛在感興趣的項(xiàng)目;考慮到系統(tǒng)的項(xiàng)目比較多,用戶交互項(xiàng)目的數(shù)量很大,所以只篩選出推薦度最大的N個(gè)項(xiàng)目,形成Top-N推薦集,設(shè)定N=5。

3生物信息學(xué)推薦系統(tǒng)的實(shí)現(xiàn)

生物信息學(xué)推薦系統(tǒng)的實(shí)現(xiàn)可以用圖4來(lái)表示。數(shù)據(jù)庫(kù)部分主要存儲(chǔ)用戶信息和項(xiàng)目信息,用SQLServer2000實(shí)現(xiàn)。

數(shù)據(jù)訪問(wèn)層實(shí)現(xiàn)了與用戶交互必需的存儲(chǔ)過(guò)程以及觸發(fā)器,也使用SQLServer2000,主要完成以下功能:初始化新用戶信息矩陣;插入新項(xiàng)目時(shí)更新所有用戶的信息矩陣;用戶點(diǎn)擊項(xiàng)目時(shí)更新該用戶對(duì)項(xiàng)目的評(píng)價(jià);刪除項(xiàng)目時(shí)更新所有用戶的信息矩陣。用戶訪問(wèn)層主要涉及網(wǎng)頁(yè)與用戶的交互和調(diào)用數(shù)據(jù)訪問(wèn)層的存儲(chǔ)過(guò)程,在這里不做詳細(xì)的介紹。

推薦算法完成整個(gè)個(gè)性化推薦的任務(wù),用Java實(shí)現(xiàn)。(1)數(shù)據(jù)連接類DataCon。該類完成與SQLServer2000數(shù)據(jù)庫(kù)的連接,在連接之前必須要下載三個(gè)與SQLServer連接相關(guān)的包,即msutil.jar、msbase.jar和mssqlserver.jar。

(2)數(shù)據(jù)操作類DataControl。該類負(fù)責(zé)推薦算法與數(shù)據(jù)庫(kù)的數(shù)據(jù)交換,靜態(tài)成員Con調(diào)用DataCon.getcon()獲得數(shù)據(jù)庫(kù)連接,然后對(duì)數(shù)據(jù)庫(kù)進(jìn)行各種操作。把所有方法編寫成靜態(tài),便于推薦算法中不創(chuàng)建對(duì)象就可以直接調(diào)用。

(3)RecmmendSource與CurrentUserNeighbor。這兩個(gè)類作為FCRecommand類的內(nèi)部類,RecmmendSource用于保存當(dāng)前用戶的推薦列表,包括推薦項(xiàng)目號(hào)和推薦度;CurrentUserNeighbor用于保存鄰居信息,包括鄰居ID號(hào)、相似度及其訪問(wèn)信息。

(4)協(xié)同過(guò)濾推薦算法FCRecommand。該類實(shí)現(xiàn)了整個(gè)推薦算法,主要分為鄰居形成方法FCArithmetic和推薦形成方法GenerateRecommend。

下面給出方法FCArithmetic的關(guān)鍵代碼:

Matrixuser_item=this.User_Item_Arry();//獲取用戶—項(xiàng)目矩陣

user_item=this.SVD_Calculate(user_item);//調(diào)用SVD降維方法

Vectorc_uservector=newVector();//當(dāng)前用戶向量

Vectoro_uservector=newVector();//其他用戶向量

Vectorc_user_correlate_vector=newVector();

//當(dāng)前用戶與其他用戶之間相似度向量

for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));

//1.獲得當(dāng)前用戶向量

for(intk=0;ko_uservector.clear();

for(intl=0;lo_uservector.addElement(user_item.get(k,l));

//2.獲得其他用戶的向量

//3.計(jì)算當(dāng)前用戶與其他用戶的相似度

usercorrelativity=this.Correlativity(c_uservector,o_uservector);

c_user_correlate_vector.addElement(usercorrelativity);

}

//4.根據(jù)當(dāng)前用戶與其他用戶的相似度,計(jì)算其鄰居

this.FindUserNeighbor(i,c_user_correlate_vector);

}

根據(jù)鄰居形成方法FCArithmetic,可以得到每個(gè)用戶的鄰居。作為測(cè)試用例,圖6顯示用戶Jack與系統(tǒng)中一部分用戶的相似度,可以看出它與自己的相似度必定最高;并且它與用戶Sugx訪問(wèn)了相同的項(xiàng)目,它們之間的相似度也為1,具有極高的相似度。

4結(jié)束語(yǔ)

在傳統(tǒng)推薦系統(tǒng)的基礎(chǔ)上,結(jié)合當(dāng)前生物信息學(xué)網(wǎng)站的特點(diǎn),提出一個(gè)基于生物信息平臺(tái)的推薦系統(tǒng),解決了傳統(tǒng)生物信息網(wǎng)站平臺(tái)信息迷茫的缺點(diǎn),為用戶推薦其感興趣物種的DNA或蛋白質(zhì)序列。

優(yōu)點(diǎn)在于協(xié)同過(guò)濾的推薦算法能發(fā)現(xiàn)用戶潛在的興趣,能促進(jìn)生物學(xué)家之間的交流;推薦算法的鄰居形成與推薦形成兩部分可以單獨(dú)運(yùn)行,減少了系統(tǒng)的開(kāi)銷。進(jìn)一步的工作是分析生物數(shù)據(jù)的特點(diǎn)及生物數(shù)據(jù)之間的關(guān)系,增加用戶和項(xiàng)目數(shù)量,更好地發(fā)揮推薦系統(tǒng)的優(yōu)勢(shì)。

參考文獻(xiàn):

[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.

[2]陳新.生物信息學(xué)簡(jiǎn)介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.

[3]林毅申,林丕源.基于WebServices的生物信息解決方案[J].計(jì)算機(jī)應(yīng)用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次數(shù)據(jù)庫(kù)建立及應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2004(11):58-60.

[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.

[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.

[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.

[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).cs.dartmouth.edu/reports/TR98-338.pdf.

第2篇

關(guān)鍵詞:生物信息學(xué) 交叉學(xué)科 學(xué)生培養(yǎng)

一、生物信息學(xué)的產(chǎn)生

生物學(xué)是一門古老的學(xué)科,在人類歷史發(fā)展的長(zhǎng)河中,人類從未停止過(guò)對(duì)生命奧秘的探索。人們逐漸認(rèn)識(shí)到,雖然生物種類多種多樣,但是它們的最基本分子卻是相同的。DNA、RNA和蛋白質(zhì)等分子構(gòu)成了生命的基本單位,再由細(xì)胞到組織、器官,最后器官系統(tǒng)組成完整的生物體。

傳統(tǒng)的生物學(xué)研究中,由于受到技術(shù)水平的限制,生物學(xué)家多采用低通量的生物實(shí)驗(yàn)方法,其研究對(duì)象通常是一個(gè)基因或者幾個(gè)基因組成的通路。在這種情況下,實(shí)驗(yàn)后的簡(jiǎn)單觀察就可以滿足研究需要。隨著生物研究的不斷深入,積累了大量實(shí)驗(yàn)數(shù)據(jù),人們不禁想到,如何把不同的實(shí)驗(yàn)結(jié)果整合起來(lái)?另一方面,隨著生物技術(shù)的發(fā)展,大量新興技術(shù)出現(xiàn),產(chǎn)生了海量的數(shù)據(jù)。例如90年代興起的基因芯片技術(shù),單張芯片就可以測(cè)定成千上萬(wàn)個(gè)基因在某一狀態(tài)下的表達(dá)情況。1990年啟動(dòng)的人類基因組計(jì)劃更為生命科學(xué)的研究提供了海量的序列數(shù)據(jù)。面對(duì)如此多的數(shù)據(jù),以前依靠生物實(shí)驗(yàn)研究單個(gè)或幾個(gè)基因的方法很難再適用,生命科學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)和信息科學(xué)等若干學(xué)科的交叉學(xué)科――生物信息學(xué)應(yīng)運(yùn)而生。生物信息學(xué)以計(jì)算機(jī)、統(tǒng)計(jì)、模式識(shí)別等方法為手段,以生物數(shù)據(jù)為研究對(duì)象,通過(guò)對(duì)大量生物數(shù)據(jù)的儲(chǔ)存、處理和分析,提取其中有意義的生物知識(shí)[1],從而最終揭示蘊(yùn)藏在核酸序列和蛋白質(zhì)序列中的信息,對(duì)了解生命活動(dòng)的基本規(guī)律出貢獻(xiàn)。

二、生物信息學(xué)在生命科學(xué)研究中的作用

作為一門新興的學(xué)科,大家對(duì)生物信息的作用并不十分明確。很多人認(rèn)為生物信息學(xué)只是為實(shí)驗(yàn)科學(xué)服務(wù)。從廣義上講,這種說(shuō)法也不無(wú)道理,但是生物信息學(xué)并不是實(shí)驗(yàn)科學(xué)的附屬品,與生物實(shí)驗(yàn)一樣,它也是解決生物問(wèn)題的一種手段。為了解決生物問(wèn)題,生物學(xué)家依靠的是實(shí)驗(yàn)臺(tái),生物信息學(xué)家依靠的是計(jì)算機(jī)。

在生命科學(xué)的發(fā)展過(guò)程中,以分子生物學(xué)的產(chǎn)生為界,可以分為傳統(tǒng)生物學(xué)和現(xiàn)代生物學(xué)。傳統(tǒng)生物學(xué)和現(xiàn)代生物學(xué)取得的成就為生命科學(xué)的發(fā)展做出了巨大貢獻(xiàn)。人類基因組計(jì)劃啟動(dòng)以來(lái),人們一度認(rèn)為只要把各種生物基因組的全部堿基排列順序測(cè)定清楚,生命的遺傳奧秘就會(huì)顯露無(wú)余,但是真實(shí)的情況遠(yuǎn)不像想象的那樣簡(jiǎn)單。人類的個(gè)體發(fā)育開(kāi)始于一個(gè)單細(xì)胞受精卵,受精卵經(jīng)過(guò)一系列的細(xì)胞分裂和分化,產(chǎn)生具有不同形態(tài)和功能的細(xì)胞,不同細(xì)胞之間相互作用構(gòu)成各種組織和器官。雖然人類基因組中有兩萬(wàn)多個(gè)基因,但是在單個(gè)細(xì)胞當(dāng)中,同時(shí)起作用的基因往往是很少的。有些基因只在特定階段起作用,有些基因只在特定組織起作用。只關(guān)心某個(gè)基因或蛋白的功能是不夠的,因?yàn)樵诓煌瑫r(shí)空條件下,同一個(gè)基因或蛋白的功能可能不同。生物是一個(gè)復(fù)雜的系統(tǒng),其表型和功能不僅體現(xiàn)于基因數(shù)量和序列的不同,更體現(xiàn)在基因、蛋白以及其他生物分子之間的相互作用之中。因此,把研究對(duì)象當(dāng)成一個(gè)整體,系統(tǒng)地分析內(nèi)部的相互關(guān)系尤其重要。但是無(wú)論是傳統(tǒng)生物學(xué)還是現(xiàn)代生物學(xué),都是一門實(shí)驗(yàn)學(xué)科,生物學(xué)的發(fā)展中缺乏一種系統(tǒng)思想。生物信息學(xué)可以從大量生物數(shù)據(jù)中提取有意義的生物知識(shí),通過(guò)對(duì)已有數(shù)據(jù)的總結(jié),進(jìn)一步推測(cè)生物體的某些性質(zhì)和變化趨勢(shì),生物信息學(xué)為大量生物數(shù)據(jù)的整合提供了可能,與生物實(shí)驗(yàn)一樣,是生物研究中的一種重要途徑。

三、生物信息學(xué)學(xué)生的培養(yǎng)

生物信息學(xué)是一門交叉學(xué)科,要求學(xué)生具有較好的分子生物學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)素養(yǎng),目前國(guó)內(nèi)只有少數(shù)幾個(gè)學(xué)校設(shè)立了生物信息學(xué)本科專業(yè),大部分的學(xué)生都是進(jìn)入研究生階段才開(kāi)始生物信息學(xué)的培養(yǎng)。在進(jìn)入生物信息學(xué)專業(yè)前,本科階段可能接受過(guò)計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、信息學(xué)、生物學(xué)等某一方面的教育,但要進(jìn)行生物信息學(xué)的研究,大多需要補(bǔ)充其他方面的知識(shí)。

生物信息學(xué)研究可以分為兩類:第一,在深刻理解生物問(wèn)題的基礎(chǔ)上,利用計(jì)算技術(shù)解決生物問(wèn)題,第二,為生物學(xué)家提供性能更好的方法(算法)。理工科背景學(xué)生的生物知識(shí)較少,但是對(duì)于各種計(jì)算方法的原理和使用非常熟悉,對(duì)于這類學(xué)生的培養(yǎng),第二類問(wèn)題比較適合他們?nèi)腴T。在生物信息領(lǐng)域,有很多經(jīng)典的分類問(wèn)題。這些問(wèn)題已經(jīng)明確了分類目標(biāo),并且大都有通用的數(shù)據(jù)集。但是這類工作也受到了生物學(xué)家的質(zhì)疑,因?yàn)榇蟛糠止ぷ鞫际前岩延械慕?jīng)典算法用在生物數(shù)據(jù)上,由于對(duì)生物問(wèn)題不夠了解,最后成為只有做生物信息的人才看的方法。這也在一定程度上導(dǎo)致了部分生物學(xué)家對(duì)生物信息存在偏見(jiàn),認(rèn)為生物信息就是提出新算法,做一些數(shù)據(jù)庫(kù)。要想真正讓生物學(xué)家認(rèn)識(shí)到生物信息學(xué)的重要性,就要以解決生物問(wèn)題為根本出發(fā)點(diǎn),即使是做預(yù)測(cè)方法,也要建立在解決生物問(wèn)題的基礎(chǔ)上。做出更好預(yù)測(cè)方法的關(guān)鍵是深入理解生物問(wèn)題并抓住關(guān)鍵特征。舉個(gè)例子,要把男生和女生分開(kāi),我們可以根據(jù)很多特征,比如身高、體重、頭發(fā)長(zhǎng)短,雖然大多數(shù)情況下來(lái)說(shuō),男生比女生高、比女生重、比女生頭發(fā)短。但是只基于這些特征還是會(huì)造成很多的分類錯(cuò)誤,因?yàn)檫@些特征不是男生女生差別的最根本因素。如果我們是根據(jù)性染色體來(lái)分,那正確率的提高就非常顯著了。在預(yù)測(cè)問(wèn)題中,利用五花八門的方法并不是關(guān)鍵,如何能夠?qū)ι飭?wèn)題深入了解并找到關(guān)鍵特征,才是最主要的。

作為一門新興的學(xué)科,大家對(duì)生物信息的了解還很少,很多人對(duì)它的定位也不同。但既然是生物信息,就是先生物后信息,可見(jiàn)生物的重要性。所以,在生物信息的研究過(guò)程中,對(duì)生物問(wèn)題只限于表面地理解,勢(shì)必不能做出好的工作。只有對(duì)生物問(wèn)題有了深入了解,才能發(fā)現(xiàn)其中的問(wèn)題。能夠找到值得做的問(wèn)題,可以說(shuō)工作已經(jīng)成功了一大半。當(dāng)然,解決問(wèn)題過(guò)程中也會(huì)有很多困難,比如發(fā)現(xiàn)了值得研究的課題,但在解決的過(guò)程當(dāng)中發(fā)現(xiàn)某些數(shù)據(jù)無(wú)法獲得,或者某些技術(shù)超出了自己的能力范圍。在這種情況下,可以首先想想有沒(méi)有其它變通的辦法可以解決問(wèn)題,如果經(jīng)過(guò)慎重的考慮都無(wú)法找到,就要果斷的放棄。這里要強(qiáng)調(diào)一定要慎重考慮,不能遇到一點(diǎn)困難就放棄。

相比理工科背景的學(xué)生,生物背景的學(xué)生有著扎實(shí)的生物學(xué)知識(shí)基礎(chǔ)。但是如果是從本科階段直接進(jìn)入生物信息學(xué),由于還沒(méi)有進(jìn)行過(guò)實(shí)驗(yàn)操作,他們對(duì)生物問(wèn)題的理解也很難非常深入。不管是理工科背景還是生物背景的學(xué)生,豐富的生物學(xué)知識(shí)都是進(jìn)行好的生物信息學(xué)研究的前提。在培養(yǎng)學(xué)生時(shí)不可忽視對(duì)其基礎(chǔ)生物學(xué)知識(shí)的傳授和教育,并適當(dāng)引導(dǎo)其對(duì)生物學(xué)問(wèn)題的思考。生物學(xué)問(wèn)題可以很大也可以很小。大的生物學(xué)問(wèn)題任何一個(gè)懂得基礎(chǔ)生物學(xué)知識(shí)的人都可以提出,但也是最難解決的,比如到底是什么改變使細(xì)胞惡變,自身免疫病是如何形成的,心血管病糖尿病等復(fù)雜疾病是如何發(fā)生的,為何有人容易生某種病而其他人不易感。小的生物學(xué)問(wèn)題就是各自領(lǐng)域的具體研究課題,比如表觀遺傳學(xué)領(lǐng)域的DNA去甲基化酶是否存在,基因表達(dá)調(diào)控領(lǐng)域的轉(zhuǎn)錄起始頻率是如何決定的,RNA領(lǐng)域的大量非編碼RNA的作用,蛋白修飾領(lǐng)域新發(fā)現(xiàn)的修飾如何調(diào)控蛋白的功能等等。在腦中提出并試圖思考一系列大大小小的生物學(xué)問(wèn)題是對(duì)學(xué)生培養(yǎng)目標(biāo)的第一步。這些問(wèn)題的產(chǎn)生的前提是對(duì)生物學(xué)知識(shí)的熟悉掌握。然而在對(duì)學(xué)生培養(yǎng)的過(guò)程中沒(méi)必要也不可能告訴他們所有的知識(shí),生物學(xué)知識(shí)教育的原則是為他們打開(kāi)門,當(dāng)他們思考問(wèn)題的時(shí)候知道去哪里找到相關(guān)的知識(shí)。

另一方面,只有生物學(xué)基礎(chǔ)知識(shí)和問(wèn)題是不夠的。很多問(wèn)題在生物信息學(xué)產(chǎn)生之前就存在了,傳統(tǒng)的方法無(wú)法帶給人們問(wèn)題的答案。人們一直期待新的方法去理解和解決這些問(wèn)題。生物信息學(xué)的產(chǎn)生無(wú)疑提供給人們另一種思考生物問(wèn)題的方式,為一些經(jīng)典問(wèn)題的解決提供了可能。例如最近的大規(guī)模的腫瘤基因組測(cè)序和分析使我們發(fā)現(xiàn)了很多新的腫瘤相關(guān)基因[2]。對(duì)于生物背景的學(xué)生,在教學(xué)中要把這樣的例子介紹給學(xué)生,生物背景的學(xué)生在理解信息學(xué)理論方面會(huì)存在困難。最初很難要求他們理解所有具體過(guò)程。但是至少要讓他們知道這些方法的基本原理,還有在什么情況下使用。這樣在以后的研究中遇到類似問(wèn)題才能想到應(yīng)該選擇什么樣的信息學(xué)工具去解決,在具體應(yīng)用過(guò)程中加深對(duì)整個(gè)過(guò)程的理解。生物背景的學(xué)生如果想成為生物信息學(xué)專家,只會(huì)應(yīng)用是不夠的,補(bǔ)充一些計(jì)算機(jī)、統(tǒng)計(jì)、信息方面的基礎(chǔ)知識(shí)是必不可少的。

生物信息學(xué)是一門仍處在快速發(fā)展之中的學(xué)科。還沒(méi)有一本教材能夠滿足生物信息學(xué)教學(xué)的需要,生物信息學(xué)立足于分子生物學(xué)、模式識(shí)別、計(jì)算機(jī)科學(xué)與技術(shù)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)等學(xué)科,所以學(xué)生要先對(duì)這些學(xué)科的基本概念和系統(tǒng)有一個(gè)較為全面和直觀的認(rèn)識(shí),為日后的科研打下堅(jiān)實(shí)的基礎(chǔ)。另外,培養(yǎng)過(guò)程中要包括大量的實(shí)例介紹,對(duì)一些重要的應(yīng)用還加以詳細(xì)解剖,使得同學(xué)們不再僅掌握理論,而是能夠?qū)W會(huì)如何在實(shí)際工作中靈活應(yīng)用這些理論。在此基礎(chǔ)之上,向同學(xué)們推薦一些最新的論文、期刊、參考讀物和相關(guān)的學(xué)術(shù)報(bào)告,讓同學(xué)們能夠切身感受到學(xué)科發(fā)展的前沿,培養(yǎng)學(xué)生的創(chuàng)新能力。21世紀(jì)是生命科學(xué)的時(shí)代,也是信息科學(xué)的時(shí)代。生物信息學(xué)在這樣的歷史條件下產(chǎn)生并壯大,它作為多個(gè)領(lǐng)域的交叉新興學(xué)科,對(duì)生命科學(xué)研究有著巨大的推動(dòng)力。生物信息學(xué)是一門應(yīng)用性非常強(qiáng)的學(xué)科,也是一門非常活躍的前沿學(xué)科,良好的教學(xué)效果必須以先進(jìn)的內(nèi)容體系為基礎(chǔ),我們應(yīng)時(shí)刻注意以科研促進(jìn)教學(xué),教學(xué)科研相長(zhǎng),使教學(xué)研究達(dá)到更高的水平。

[參考文獻(xiàn)]

[1]蔣彥等.基礎(chǔ)生物信息學(xué)及應(yīng)用[M].北京:清華大學(xué)出版社,2003

第3篇

中圖分類號(hào): G643;Q-3 文獻(xiàn)標(biāo)識(shí)碼: B 文章編號(hào): 1008-2409(2008)05-0967-03

人類基因組計(jì)劃的成功實(shí)施使生命科學(xué)進(jìn)入了信息時(shí)代。基因組學(xué)、蛋白質(zhì)組學(xué)和生物芯片 技術(shù)的發(fā)展,使得與生命科學(xué)相關(guān)的數(shù)據(jù)量呈線性高速增長(zhǎng)。對(duì)這些數(shù)據(jù)全面、正確的解讀 ,為闡明生命的本質(zhì)提供了可能。連接生物數(shù)據(jù)與醫(yī)學(xué)科學(xué)研究的是生物信息學(xué)(Bioinform atics)。應(yīng)用生物信息學(xué)研究方法分析生物數(shù)據(jù),提出與疾病發(fā)生、發(fā)展相關(guān)的基因或基因 群,再進(jìn)行實(shí)驗(yàn)驗(yàn)證,是一條高效的研究途經(jīng)。醫(yī)學(xué)是研究生命的科學(xué),醫(yī)學(xué)研究在基礎(chǔ)上 就注定離不開(kāi)對(duì)生物信息的了解。

我國(guó)目前醫(yī)學(xué)研究生教學(xué)模式主要有兩種, 一是醫(yī)學(xué)本科教育延續(xù)過(guò)來(lái)的理論型, 這種類型 的教育是在本科教學(xué)大綱的基礎(chǔ)上, 按照教學(xué)計(jì)劃進(jìn)行理論講授, 最后按照導(dǎo)師指定的課題 完成畢業(yè)論文。這種培養(yǎng)模式突出理論學(xué)習(xí), 忽視了實(shí)驗(yàn)機(jī)能和科研能力的培養(yǎng)。二是科研 能力培養(yǎng)的前輕后重型, 前期只是進(jìn)行理論授課, 后期由導(dǎo)師指導(dǎo)學(xué)生的科研。這種模式雖 然開(kāi)設(shè)了一定的實(shí)驗(yàn)項(xiàng)目, 但對(duì)研究生科研能力的培養(yǎng)缺乏系統(tǒng)性, 并且前期的培養(yǎng)不足直 接影響到研究生后期的學(xué)位課題和論文的進(jìn)度、質(zhì)量。

因此,筆者對(duì)生物信息學(xué)在醫(yī)學(xué)碩士研究生中的教育初探,不但有利于該門課程尚未完全形 成成熟的課程體系之際,為教師學(xué)習(xí)借鑒先進(jìn)的教育思想與教學(xué)實(shí)踐經(jīng)驗(yàn),更有利于醫(yī)學(xué)碩 士研究生對(duì)生物信息學(xué)的學(xué)習(xí)。

1 生物信息學(xué)的研究范圍

生物信息學(xué)是一門新興的交叉學(xué)科,涉及生物學(xué)、數(shù)學(xué)和信息科學(xué)等學(xué)科領(lǐng)域,并注定以互 聯(lián)網(wǎng)為媒介,數(shù)據(jù)庫(kù)為載體,利用數(shù)學(xué)知識(shí)、各種計(jì)算模型,并以計(jì)算機(jī)為工具,進(jìn)行各種 生物信息分析,以理解海量分子數(shù)據(jù)中的生物學(xué)含義。

生物信息包括多種類型的數(shù)據(jù),如核酸和蛋白質(zhì)序列、蛋白質(zhì)二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)的數(shù)據(jù)等 。由實(shí)驗(yàn)獲得的核酸蛋白序列和三維結(jié)構(gòu)數(shù)據(jù)等構(gòu)成初級(jí)數(shù)據(jù),由此構(gòu)建的數(shù)據(jù)庫(kù)稱初級(jí)數(shù) 據(jù)庫(kù)。由初級(jí)數(shù)據(jù)分析得來(lái)的諸如二級(jí)結(jié)構(gòu)、疏水位點(diǎn)、結(jié)構(gòu)域(Domain),由核酸序列翻譯 來(lái)的蛋白質(zhì)以及預(yù)測(cè)的二級(jí)三級(jí)結(jié)構(gòu),稱為二級(jí)數(shù)據(jù)。創(chuàng)新算法和軟件是生物信息學(xué)持續(xù)發(fā) 展的基礎(chǔ),高通量生物學(xué)研究方法和平臺(tái)技術(shù)是驗(yàn)證生物信息學(xué)研究結(jié)果的關(guān)鍵技術(shù)。因此 ,現(xiàn)代生物信息學(xué)是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué) 等學(xué)科相互滲透而形成的交叉學(xué)科,是應(yīng)用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列 等各種生物信息的采集、存儲(chǔ)、傳遞、檢索、分析和解讀,以幫助了解生物學(xué)和遺傳學(xué)信息 的科學(xué)。從其研究所涉及的學(xué)科上看,生物信息學(xué)是集生物學(xué)、數(shù)學(xué)、信息學(xué)和計(jì)算機(jī)科學(xué) 一體化的一門新的科學(xué);從其研究的主要內(nèi)容上看,基因組信息學(xué)、蛋白質(zhì)的結(jié)構(gòu)模擬以及 藥物設(shè)計(jì)是生物信息學(xué)的三個(gè)重要組成部分,并有機(jī)地結(jié)合在一起[1]。

2 醫(yī)學(xué)碩士研究生中的生物信息學(xué)教學(xué)初探

2.1 課堂教學(xué)重在教授實(shí)踐技巧與方法

生物信息學(xué)在醫(yī)學(xué)研究生中的教學(xué)應(yīng)以教授實(shí)踐技巧為主,以介紹原理為輔,深入淺出,注 重課堂知識(shí)與科研實(shí)踐的緊密結(jié)合。課堂講授應(yīng)簡(jiǎn)要介紹生物信息學(xué)的相關(guān)算法、原理,著 重介紹其使用技巧與方法,真正做到“有的放矢”,而這也是教學(xué)的重點(diǎn)和難點(diǎn)。

在教學(xué)中對(duì)于這部分內(nèi)容應(yīng)遵循深入淺出、避繁就簡(jiǎn)的原則,結(jié)合具體實(shí)例分析算法,避免 空洞復(fù)雜的算法講解讓學(xué)生覺(jué)得枯燥乏味、晦澀難懂,產(chǎn)生畏懼心理,知難而退;注重講解 使用技巧與方法的思想和來(lái)龍去脈,讓學(xué)生真正掌握解決問(wèn)題的思路,培養(yǎng)其科學(xué)思維能力 ,并采用探討式教學(xué)鼓勵(lì)學(xué)生思考,通過(guò)討論與研究的方式循序漸進(jìn)的掌握復(fù)雜的內(nèi)容,介 紹相關(guān)的教學(xué)和物理學(xué)知識(shí),使學(xué)生充分體會(huì)到生物信息學(xué)與其他學(xué)科的關(guān)系,其他學(xué)科的 思想方法對(duì)于生物科學(xué)的重要性,培養(yǎng)其自覺(jué)地將其他學(xué)科的方法和思想應(yīng)用于解決生物 學(xué)問(wèn)題的科學(xué)素質(zhì)。 任何學(xué)科都處于不斷地發(fā)展、更新中,生物信息無(wú)論是理論研究還是 應(yīng)用研究仍處于不斷發(fā)展完善中,同時(shí)隨著新的應(yīng)用領(lǐng)域和新問(wèn)題的發(fā)現(xiàn),其他學(xué)科的方 法也在不斷地應(yīng)用于生物信息學(xué),進(jìn)一步增加了其多學(xué)科交叉融合的深度和廣度。

2.2 充分利用現(xiàn)代化教育技術(shù),采用案例教學(xué)

目前,高等院校在教室內(nèi)配備的多媒體投影播放系統(tǒng),促進(jìn)了多媒體教學(xué)的廣泛應(yīng)用。生物 信息學(xué)采用多媒體教學(xué)是適應(yīng)學(xué)科特點(diǎn)、提高教學(xué)效果和充分利用現(xiàn)代化教育技術(shù)的一項(xiàng)基 本要求。作為生物信息學(xué)教學(xué)的基本模式,多媒體教學(xué)使講解的內(nèi)容更加直觀形象,尤其是 對(duì)于具體數(shù)據(jù)庫(kù)的介紹以及數(shù)據(jù)庫(kù)檢索、數(shù)據(jù)庫(kù)相似性搜索、序列分析和蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等 內(nèi)容涉及到的具體方法和工具的講解,可以激發(fā)學(xué)生的學(xué)習(xí)興趣,加深學(xué)生對(duì)知識(shí)的理解和 掌握,提高學(xué)生理論與實(shí)踐相結(jié)合的能力。

但多媒體教室也有局限性,學(xué)生主要以聽(tīng)講為主不能及時(shí)實(shí)踐,教師講解與學(xué)生實(shí)踐相脫節(jié) ,如果將生物信息學(xué)課程安排在計(jì)算機(jī)房?jī)?nèi)進(jìn)行,并采用多媒體電子教室的教學(xué)方式可以解 決上述問(wèn)題。在教學(xué)中采用啟發(fā)式教學(xué),為學(xué)生建立教學(xué)情景,學(xué)生通過(guò)與教師、同學(xué)的協(xié) 商討論,參與操作,發(fā)現(xiàn)知識(shí),理解知識(shí)并掌握知識(shí)。例如在講授“目的基因序列的查尋” 時(shí),除對(duì)基本內(nèi)容的介紹,如數(shù)據(jù)庫(kù)的發(fā)展、分類等,其他采用案例法,讓學(xué)生利用搜索工 具查找三大公共核酸數(shù)據(jù)庫(kù),并通過(guò)數(shù)據(jù)庫(kù)網(wǎng)站的介紹內(nèi)容對(duì)該數(shù)據(jù)庫(kù)的發(fā)展、內(nèi)容、特點(diǎn) 進(jìn)行學(xué)習(xí)并總結(jié),通過(guò)討論和實(shí)際的數(shù)據(jù)庫(kù)瀏覽操作了解三大公共核酸數(shù)據(jù)庫(kù)并且掌握數(shù)據(jù) 庫(kù)使用方法。

2.3 采用“講、練”一體化的教學(xué)模式,強(qiáng)調(diào)學(xué)生實(shí)踐能力的培養(yǎng)

生物信息學(xué)課堂教學(xué)積極學(xué)習(xí)借鑒職業(yè)培訓(xùn)和計(jì)算機(jī)課程教學(xué)中“講、練、做”一體化的教 學(xué)模式,在理論教學(xué)中增加實(shí)訓(xùn)內(nèi)容,在實(shí)踐教學(xué)中結(jié)合理論講授,改變了傳統(tǒng)的“以教師 為中心、以教材和講授為中心”教學(xué)方式。

根據(jù)教學(xué)內(nèi)容和學(xué)生的認(rèn)知規(guī)律,靈活地采用先理論后實(shí)踐或先實(shí)踐后理論或邊理論邊實(shí)踐 的方法,融生物信息學(xué)理論教學(xué)與實(shí)踐操作為一體,使學(xué)生的知識(shí)和能力得到同步、協(xié)調(diào)、 綜合發(fā)展。通常采用先講后練的方法,即首先介紹原理、方法,之后設(shè)計(jì)相關(guān)的實(shí)訓(xùn)內(nèi)容 讓學(xué)生上機(jī)實(shí)踐。對(duì)于操作性內(nèi)容和生物信息分析的方法和工具的講解采取了進(jìn)行實(shí)際演示 的方法,教師邊講解邊示范,學(xué)生在聽(tīng)課時(shí)邊聽(tīng)講邊練習(xí)或者教師講解結(jié)束后學(xué)生再進(jìn)行練 習(xí),理論與實(shí)踐高度結(jié)合,充分發(fā)揮課堂教學(xué)的生動(dòng)性、直觀性,加深學(xué)生對(duì)知識(shí)的理解, 培養(yǎng)和提高學(xué)生的實(shí)踐操作能力。

2.4 發(fā)揮網(wǎng)絡(luò)教學(xué)優(yōu)勢(shì),優(yōu)化生物信息學(xué)實(shí)驗(yàn)教學(xué)內(nèi)容

生物信息學(xué)實(shí)驗(yàn)教學(xué)主要是針對(duì)海量生物數(shù)據(jù)處理與分析的實(shí)際需要,培養(yǎng)學(xué)生綜合運(yùn)用生 物信息學(xué)知識(shí)和方法進(jìn)行生物信息提取、儲(chǔ)存、處理、分析的能力,提高學(xué)生應(yīng)用理論知識(shí) 解決問(wèn)題的能力和獨(dú)立思考、綜合分析的能力。生物信息學(xué)實(shí)驗(yàn)教學(xué)內(nèi)容的選擇與安排應(yīng)按 照循序漸進(jìn)的原則,針對(duì)特定的典型性的生物信息學(xué)問(wèn)題設(shè)計(jì),以綜合性、設(shè)計(jì)性實(shí)驗(yàn)內(nèi)容 為主,明確目的要求,突出重點(diǎn),充分發(fā)揮學(xué)生的主觀能動(dòng)性和探索精神,以激發(fā)學(xué)生學(xué)習(xí) 的主動(dòng)性和創(chuàng)造性為出發(fā)點(diǎn),加強(qiáng)學(xué)生創(chuàng)新精神和實(shí)驗(yàn)?zāi)芰Φ呐囵B(yǎng)。生物信息學(xué)實(shí)驗(yàn)教學(xué)以 互聯(lián)網(wǎng)為媒介、計(jì)算機(jī)為工具,全部在計(jì)算機(jī)網(wǎng)絡(luò)實(shí)驗(yàn)室內(nèi)完成。在教學(xué)中,充分利用網(wǎng)絡(luò) 的交互特點(diǎn)實(shí)現(xiàn)信息技術(shù)與課程的結(jié)合。教師通過(guò)電子郵件將實(shí)驗(yàn)教學(xué)內(nèi)容、實(shí)驗(yàn)序列、工 具等傳遞給學(xué)生,學(xué)生同樣通過(guò)電子郵件將實(shí)驗(yàn)報(bào)告、作業(yè)、問(wèn)題和意見(jiàn)等反饋給教師,教 師在網(wǎng)上批改實(shí)驗(yàn)報(bào)告后將成績(jī)和評(píng)語(yǔ)發(fā)送給學(xué)生,讓學(xué)生及時(shí)了解自己的學(xué)習(xí)情況。

生物信息實(shí)驗(yàn)教學(xué)與現(xiàn)代網(wǎng)絡(luò)和信息技術(shù)密不可分,在教學(xué)工作中充分利用現(xiàn)代教育技術(shù)較 其他課程更具優(yōu)勢(shì)。區(qū)別于其他生命科學(xué)課程,在教學(xué)過(guò)程中要求有發(fā)達(dá)的互聯(lián)網(wǎng)和計(jì)算機(jī) 作為必備條件。調(diào)查顯示國(guó)內(nèi)高校都已建立校園網(wǎng),其中擁有1000 M主干帶寬的高校已占調(diào) 查 總數(shù)的64.9%,2005年一些綜合類大學(xué)和理工類院校將率先升級(jí)到萬(wàn)兆校園網(wǎng)[2] ,這些都為生物信息學(xué)課程在高校開(kāi)設(shè)提供了良好的物質(zhì)基礎(chǔ)。

2.5 考試無(wú)紙化,加強(qiáng)實(shí)踐能力考核

考試重點(diǎn)是考查學(xué)生對(duì)生物信息分析的基本方法和技能的掌握程度和對(duì)結(jié)果的分析解釋能力 。因此,在生物信息學(xué)考試中嘗試引入實(shí)踐技能考試,重點(diǎn)考核學(xué)生知識(shí)應(yīng)用能力。實(shí)踐技 能考試采用無(wú)紙化考試方式,學(xué)生在互聯(lián)網(wǎng)環(huán)境下,對(duì)序列進(jìn)行生物信息分析并對(duì)結(jié)果進(jìn)行 解釋,不僅考核學(xué)生對(duì)基本知識(shí)和基本原理的掌握,而且考查學(xué)生進(jìn)行生物信息分析的實(shí)際 能力和分析思考能力。通過(guò)實(shí)踐技能考試,淡化理論考試,克服傳統(tǒng)的死記硬背,促進(jìn)學(xué)生 注重提高理論用于實(shí)踐的綜合能力,同時(shí)更有效地提高學(xué)生計(jì)算機(jī)應(yīng)用能力。除采用實(shí)踐技 能考試并將其作為學(xué)生成績(jī)的主要部分外,還加強(qiáng)了對(duì)學(xué)生平時(shí)學(xué)習(xí)態(tài)度、學(xué)習(xí)能力、創(chuàng)新 思維等方面的考核。

總之,生物信息學(xué)教學(xué)是網(wǎng)絡(luò)環(huán)境下生物教學(xué)的全新內(nèi)容。通過(guò)上述教學(xué)措施,提高了學(xué)生 的 學(xué)習(xí)積極性、實(shí)踐操作能力、解決實(shí)際問(wèn)題的綜合應(yīng)用能力及創(chuàng)新能力,收到了良好的教學(xué) 效果,得到了學(xué)生的普遍歡迎,具有較強(qiáng)的可操作性和實(shí)踐性。在今后的教學(xué)實(shí)踐中,隨著 教師自身素質(zhì)的提高和進(jìn)一步的教學(xué)改革將會(huì)不斷完善生物信息學(xué)教學(xué),培養(yǎng)具有“大科學(xué) ”素質(zhì)和意識(shí)的醫(yī)學(xué)研究生人才。

參考文獻(xiàn):

[1] 張陽(yáng)德.生物信息學(xué)[M].北京:科學(xué)出版社,2004:4.

第4篇

關(guān)鍵詞: 生物信息學(xué) 農(nóng)業(yè)研究領(lǐng)域 應(yīng)用

“生物信息學(xué)”是英文單詞“bioinformatics”的中文譯名,其概念是1956年在美國(guó)田納西州gatlinburg召開(kāi)的“生物學(xué)中的信息理論”討論會(huì)上首次被提出的[1],由美國(guó)學(xué)者lim在1991年發(fā)表的文章中首次使用。生物信息學(xué)自產(chǎn)生以來(lái),大致經(jīng)歷了前基因組時(shí)代、基因組時(shí)代和后基因組時(shí)代三個(gè)發(fā)展階段[2]。2003年4月14日,美國(guó)人類基因組研究項(xiàng)目首席科學(xué)家collins f博士在華盛頓隆重宣布人類基因組計(jì)劃(human genome project,hgp)的所有目標(biāo)全部實(shí)現(xiàn)[3]。這標(biāo)志著后基因組時(shí)代(post genome era,pge)的來(lái)臨,是生命科學(xué)史中又一個(gè)里程碑。生物信息學(xué)作為21世紀(jì)生物技術(shù)的核心,已經(jīng)成為現(xiàn)代生命科學(xué)研究中重要的組成部分。研究基因、蛋白質(zhì)和生命,其研究成果必將深刻地影響農(nóng)業(yè)。本文重點(diǎn)闡述生物信息學(xué)在農(nóng)業(yè)模式植物、種質(zhì)資源優(yōu)化、農(nóng)藥的設(shè)計(jì)開(kāi)發(fā)、作物遺傳育種、生態(tài)環(huán)境改善等方面的最新研究進(jìn)展。

1.生物信息學(xué)在農(nóng)業(yè)模式植物研究領(lǐng)域中的應(yīng)用

1997年5月美國(guó)啟動(dòng)國(guó)家植物基因組計(jì)劃(npgi),旨在繪出包括玉米、大豆、小麥、大麥、高粱、水稻、棉花、西紅柿和松樹(shù)等十多種具有經(jīng)濟(jì)價(jià)值的關(guān)鍵植物的基因圖譜。國(guó)家植物基因組計(jì)劃是與人類基因組工程(hgp)并行的龐大工程[4]。近年來(lái),通過(guò)各國(guó)科學(xué)家的通力合作,植物基因組研究取得了重大進(jìn)展,擬南芥、水稻等模式植物已完成了全基因組測(cè)序。人們可以使用生物信息學(xué)的方法系統(tǒng)地研究這些重要農(nóng)作物的基因表達(dá)、蛋白質(zhì)互作、蛋白質(zhì)和核酸的定位、代謝物及其調(diào)節(jié)網(wǎng)絡(luò)等,從而從分子水平上了解細(xì)胞的結(jié)構(gòu)和功能[5]。目前已經(jīng)建立的農(nóng)作物生物信息學(xué)數(shù)據(jù)庫(kù)研究平臺(tái)有植物轉(zhuǎn)錄本(ta)集合數(shù)據(jù)庫(kù)tigr、植物核酸序列數(shù)據(jù)庫(kù)plantgdb、研究玉米遺傳學(xué)和基因組學(xué)的mazegdb數(shù)據(jù)庫(kù)、研究草類和水稻的gramene數(shù)據(jù)庫(kù)、研究馬鈴薯的pomamo數(shù)據(jù)庫(kù),等等。

2.生物信息學(xué)在種質(zhì)資源保存研究領(lǐng)域中的應(yīng)用

種質(zhì)資源是農(nóng)業(yè)生產(chǎn)的重要資源,它包括許多農(nóng)藝性狀(如抗病、產(chǎn)量、品質(zhì)、環(huán)境適應(yīng)性基因等)的等位基因。植物種質(zhì)資源庫(kù)是指以植物種質(zhì)資源為保護(hù)對(duì)象的保存設(shè)施。至1996年,全世界已建成了1300余座植物種質(zhì)資源庫(kù),在我國(guó)也已建成30多座作物種質(zhì)資源庫(kù)。種質(zhì)入庫(kù)保存類型也從單一的種子形式,發(fā)展到營(yíng)養(yǎng)器官、細(xì)胞和組織,甚至dna片段等多種形式。保護(hù)的物種也從有性繁殖植物擴(kuò)展到無(wú)性繁殖植物及頑拗型種子植物等[6]。近年來(lái),人們?cè)絹?lái)越多地應(yīng)用各種分子標(biāo)記來(lái)鑒定種質(zhì)資源。例如微衛(wèi)星、aflp、ssap、rbip和snp等。由于對(duì)種質(zhì)資源進(jìn)行分子標(biāo)記產(chǎn)生了大量的數(shù)據(jù),因此需要建立生物信息學(xué)數(shù)據(jù)庫(kù)和采用分析工具來(lái)實(shí)現(xiàn)對(duì)這些數(shù)據(jù)的查詢、統(tǒng)計(jì)和計(jì)算機(jī)分析等[7]。

3.生物信息學(xué)在農(nóng)藥設(shè)計(jì)開(kāi)發(fā)研究領(lǐng)域中的應(yīng)用

傳統(tǒng)的藥物研制主要是從大量的天然產(chǎn)物、合成化合物,以及礦物中進(jìn)行篩選,得到一個(gè)可供臨床使用的藥物要耗費(fèi)大量的時(shí)間與金錢。生物信息學(xué)在藥物研發(fā)中的意義在于找到病理過(guò)程中關(guān)鍵性的分子靶標(biāo)、闡明其結(jié)構(gòu)和功能關(guān)系,從而指導(dǎo)設(shè)計(jì)能激活或阻斷生物大分子發(fā)揮其生物功能的治療性藥物,使藥物研發(fā)之路從過(guò)去的偶然和盲目中找到正確的研發(fā)方向。生物信息學(xué)為藥物研發(fā)提供了新的手段[8,9],導(dǎo)致了藥物研發(fā)模式的改變[10]。目前,生物信息學(xué)促進(jìn)農(nóng)藥研制已有許多成功的例子。itzstein等設(shè)計(jì)出兩種具有與唾液酸酶結(jié)合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者與唾液酸酶的結(jié)合活性的250倍[11]。目前,這兩種新藥已經(jīng)進(jìn)入臨床試驗(yàn)階段。tang sy等學(xué)者研制出新一代抗aids藥物saquinavir[12]。pungpo等已經(jīng)設(shè)計(jì)出幾種新型高效的抗hiv-1型藥物[13]。楊華錚等人設(shè)計(jì)合成了十多類數(shù)百個(gè)除草化合物,經(jīng)生物活性測(cè)定,部分化合物的活性已超過(guò)商品化光合作用抑制劑的水平[14]。

現(xiàn)代農(nóng)藥的研發(fā)已離不開(kāi)生物信息技術(shù)的參與,隨著生物信息學(xué)技術(shù)的進(jìn)一步完善和發(fā)展,將會(huì)大大降低藥物研發(fā)的成本,提高研發(fā)的質(zhì)量和效率。

4.生物學(xué)信息學(xué)在作物遺傳育種研究領(lǐng)域中的應(yīng)用

隨著主要農(nóng)作物遺傳圖譜精確度的提高,以及特定性狀相關(guān)分子基礎(chǔ)的進(jìn)一步闡明,人們可以利用生物信息學(xué)的方法,先從模式生物

中尋找可能的相關(guān)基因,然后在作物中找到相應(yīng)的基因及其位點(diǎn)。農(nóng)作物的遺傳學(xué)和分子生物學(xué)的研究積累了大量的基因序列、分子標(biāo)記、圖譜和功能方面的數(shù)據(jù),可通過(guò)建立生物信息學(xué)數(shù)據(jù)庫(kù)來(lái)整合這些數(shù)據(jù),從而比較和分析來(lái)自不同基因組的基因序列、功能和遺傳圖譜位置[15]。在此基礎(chǔ)上,育種學(xué)家就可以應(yīng)用計(jì)算機(jī)模型來(lái)提出預(yù)測(cè)假設(shè),從多種復(fù)雜的等位基因組合中建立自己所需要的表型,然后從大量遺傳標(biāo)記中篩選到理想的組合,從而培育出新的優(yōu)良農(nóng)作物品種。

5.生物信息學(xué)在生態(tài)環(huán)境平衡研究領(lǐng)域中的應(yīng)用

在生態(tài)系統(tǒng)中,基因流從根本上影響能量流和物質(zhì)流的循環(huán)和運(yùn)轉(zhuǎn),是生態(tài)平衡穩(wěn)定的根本因素。生物信息學(xué)在環(huán)境領(lǐng)域主要應(yīng)用在控制環(huán)境污染方面,主要通過(guò)數(shù)學(xué)與計(jì)算機(jī)的運(yùn)用構(gòu)建遺傳工程特效菌株,以降解目標(biāo)基因及其目標(biāo)污染物為切入點(diǎn),通過(guò)降解污染物的分子遺傳物質(zhì)核酸 dna,以及生物大分子蛋白質(zhì)酶,達(dá)到催化目標(biāo)污染物的降解,從而維護(hù)空氣[16]、水源、土地等生態(tài)環(huán)境的安全。

美國(guó)農(nóng)業(yè)研究中心(ars) 的農(nóng)藥特性信息數(shù)據(jù)庫(kù)(ppd) 提供 334 種正在廣泛使用的殺蟲劑信息,涉及它們?cè)诃h(huán)境中轉(zhuǎn)運(yùn)和降解途徑的16種最重要的物化特性。日本豐橋技術(shù)大學(xué)(toyohashi university of technology) 多環(huán)芳烴危險(xiǎn)性有機(jī)污染物的物化特性、色譜、紫外光譜的譜線圖。美國(guó)環(huán)保局綜合風(fēng)險(xiǎn)信息系統(tǒng)數(shù)據(jù)庫(kù)(iris) 涉及 600種化學(xué)污染物,列出了污染物的毒性與風(fēng)險(xiǎn)評(píng)價(jià)參數(shù),以及分子遺傳毒性參數(shù)[17]。除此之外,生物信息學(xué)在生物防治[18]中也起到了重要的作用。網(wǎng)絡(luò)的普及,情報(bào)、信息等學(xué)科的資源共享,勢(shì)必會(huì)創(chuàng)造出一個(gè)環(huán)境微生物技術(shù)信息的高速發(fā)展趨勢(shì)。

6.生物信息學(xué)在食品安全研究領(lǐng)域中的應(yīng)用

食品在加工制作和存儲(chǔ)過(guò)程中各種細(xì)菌數(shù)量發(fā)生變化,傳統(tǒng)檢測(cè)方法是進(jìn)行生化鑒定,但所需時(shí)間較長(zhǎng),不能滿足檢驗(yàn)檢疫部門的要求,運(yùn)用生物信息學(xué)方法獲得各種致病菌的核酸序列,并對(duì)這些序列進(jìn)行比對(duì),篩選出用于檢測(cè)的引物和探針,進(jìn)而運(yùn)用pcr法[19]、rt-pcr法、熒光rt-pcr法、多重pcr[20]和多重?zé)晒舛縫cr等技術(shù),可快速準(zhǔn)確地檢測(cè)出細(xì)菌及病毒。此外,對(duì)電阻抗、放射測(cè)量、elisa法、生物傳感器、基因芯片等[21-25]技術(shù)也是未來(lái)食品病毒檢測(cè)的發(fā)展方向。

轉(zhuǎn)基因食品檢測(cè)是通過(guò)設(shè)計(jì)特異性的引物對(duì)食品樣品的dna提取物進(jìn)行擴(kuò)增,從而判斷樣品中是否含有外源性基因片段[26]。通過(guò)對(duì)轉(zhuǎn)基因農(nóng)產(chǎn)品數(shù)據(jù)庫(kù)信息的及時(shí)更新,可準(zhǔn)確了解各國(guó)新出現(xiàn)和新批準(zhǔn)的轉(zhuǎn)基因農(nóng)產(chǎn)品,便于查找其插入的外源基因片段,以便及時(shí)對(duì)檢驗(yàn)方法進(jìn)行修改。目前由于某些通過(guò)食品傳播的病毒具有變異特性,以及檢測(cè)方法的不完善等因素影響,生物信息學(xué)在食品領(lǐng)域的應(yīng)用還比較有限,但隨著食品安全檢測(cè)數(shù)據(jù)庫(kù)的不斷完善,相信相關(guān)的生物信息學(xué)技術(shù)將在食品領(lǐng)域發(fā)揮越來(lái)越重要的作用。

生物信息學(xué)廣泛用于農(nóng)業(yè)科學(xué)研究的各個(gè)領(lǐng)域,但是僅有信息資源是不夠的,選出符合自己需求的生物信息就需要情報(bào)部門,以及信息中介服務(wù)機(jī)構(gòu)提供相關(guān)服務(wù),通過(guò)出版物、信息共享平臺(tái)、數(shù)字圖書館、電子論壇等信息媒介的幫助,科研工作者可快速有效地找到符合需要的信息。目前我國(guó)生物信息學(xué)發(fā)展還很不均衡,與國(guó)際前沿有一定差距,這需要從事信息和科研的工作者們不斷交流,使得生物信息學(xué)能夠更好地為我國(guó)農(nóng)業(yè)持續(xù)健康發(fā)展發(fā)揮作用。

參考文獻(xiàn):

[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.

[2]鄭國(guó)清,張瑞玲.生物信息學(xué)的形成與發(fā)展[j].河南農(nóng)業(yè)科學(xué),2002,(11):4-7.

[3]駱建新,鄭崛村,馬用信等.人類基因組計(jì)劃與后基因組時(shí)代.中國(guó)生物工程雜志,2003,23,(11):87-94.

[4]曹學(xué)軍.基因研究的又一壯舉——美國(guó)國(guó)家植物基因組計(jì)劃[j].國(guó)外科技動(dòng)態(tài),2001,1:24-25.

[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.

[6]盧新雄.植物種質(zhì)資源庫(kù)的設(shè)計(jì)與建設(shè)要求[j].植物學(xué)通報(bào),2006,23,(1):119-125.

[7]guy d,noel e,mik

e a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.

[8]鄭衍,王非.藥物生物信息學(xué),化學(xué)化工出版社,2004.1:214-215.

[9]俞慶森,邱建衛(wèi),胡艾希.藥物設(shè)計(jì).化學(xué)化工出版社,2005.1:160-164.

[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.

[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.

[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.

[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.

[14]楊華錚,劉華銀,鄒小毛等.計(jì)算機(jī)輔助設(shè)計(jì)與合成除草劑的研究[j].計(jì)算機(jī)與應(yīng)用化學(xué),1999,16,(5):400.

[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.

[16]王春華,謝小保,曾海燕等.深圳市空氣微生物污染狀況監(jiān)測(cè)分析[j].微生物學(xué)雜志,2008,28,(4):93-97.

[17]程樹(shù)培,嚴(yán)峻,郝春博等.環(huán)境生物技術(shù)信息學(xué)進(jìn)展[j].環(huán)境污染治理技術(shù)與設(shè)備,2002,3,(11):92-94.

[18]史應(yīng)武,婁愷,李春.植物內(nèi)生菌在生物防治中的應(yīng)用[j].微生物學(xué)雜志,2009,29,(6):61-64.

[19]趙玉玲,張?zhí)焐瑥埱善G.pcr 法快速檢測(cè)肉食品污染沙門菌的實(shí)驗(yàn)研究[j].微生物學(xué)雜志,2010,30,(3):103-105.

[20]徐義剛,崔麗春,李蘇龍等.多重pcr方法快速檢測(cè)4種主要致腹瀉性大腸埃希菌[j].微生物學(xué)雜志,2010,30,(3) :25-29.

[21]索標(biāo),汪月霞,艾志錄.食源性致病菌多重分子生物學(xué)檢測(cè)技術(shù)研究進(jìn)展[j].微生物學(xué)雜志,2010,30,(6):71-75

[22]朱曉娥,袁耿彪.基因芯片技術(shù)在基因突變?cè)\斷中的應(yīng)用及其前景[j].重慶醫(yī)學(xué),2010,(22):3128-3131.

[23]陳彥闖,辛明秀.用于分析微生物種類組成的微生物生態(tài)學(xué)研究方法[j].微生物學(xué)雜志,2009,29,(4):79-83.

[24]王大勇,方振東,謝朝新等.食源性致病菌快速檢測(cè)技術(shù)研究進(jìn)展[j].微生物學(xué)雜志,2009,29,(5):67-72.

[25]蘇晨曦,潘迎捷,趙勇等.疏水網(wǎng)格濾膜技術(shù)檢測(cè)食源性致病菌的研究進(jìn)展[j].微生物學(xué)雜志,2010,30,(6):76-81.

第5篇

【關(guān)鍵詞】云計(jì)算 生物信息學(xué)

下一代測(cè)序技術(shù)的應(yīng)用產(chǎn)生了大量的測(cè)序數(shù)據(jù),這對(duì)生物學(xué)特別是生物信息學(xué)在數(shù)據(jù)的存儲(chǔ)、管理和搜索等方面帶來(lái)了新的挑戰(zhàn)。一直以來(lái)計(jì)算機(jī)存儲(chǔ)和處理數(shù)據(jù)能力的增長(zhǎng)速度都快于生物數(shù)據(jù)的增長(zhǎng)速度,但2003年后,由于測(cè)序技術(shù)的發(fā)展使得測(cè)序成本大幅度下降,產(chǎn)生了大量的生物數(shù)據(jù),計(jì)算機(jī)的存儲(chǔ)和計(jì)算能力逐漸無(wú)法滿足大數(shù)據(jù)的需求。這促進(jìn)了云計(jì)算的運(yùn)用和發(fā)展,它使得用戶可以根據(jù)需求租用硬件設(shè)備和軟件,避免了對(duì)硬件設(shè)備的大量資金投入和管理投入。

1 云計(jì)算定義

“云”是一個(gè)通過(guò)虛擬技術(shù)把云端計(jì)算機(jī)或是服務(wù)器連接在一起的服務(wù)網(wǎng)絡(luò)。存儲(chǔ)和分析數(shù)據(jù)都由“云”端的服務(wù)器或是計(jì)算機(jī)完成。中國(guó)云計(jì)算專家劉鵬給出如下定義:“云計(jì)算是一種商業(yè)計(jì)算模型,它將計(jì)算任務(wù)分布在大量計(jì)算機(jī)構(gòu)成的資源池上,使用戶能夠按需獲取計(jì)算力、存儲(chǔ)空間和信息服務(wù)。”

按照資源的共享水平,云計(jì)算的服務(wù)模式分為三種,基礎(chǔ)架構(gòu)即服務(wù)(Infrastructure as a service), 平臺(tái)即服務(wù)(Platform as a service)和軟件即服務(wù)(Software as a service)。

IaaS(Infrastructure as a service) Service:基礎(chǔ)架構(gòu)即服務(wù)。它整合了基礎(chǔ)設(shè)施如虛擬主機(jī)、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備等資源成為一個(gè)服務(wù)平臺(tái)提供給用戶使用。IaaS位于網(wǎng)絡(luò)的底層,向用戶提供按需分配、按需付費(fèi)的計(jì)算設(shè)備和存儲(chǔ)設(shè)備。

PaaS(Platform as a service)提供服務(wù)平臺(tái),用戶掌控運(yùn)作應(yīng)用程序的環(huán)境,可以在平臺(tái)上應(yīng)用,測(cè)試和開(kāi)發(fā)軟件。

SaaS(Software as a service)即在服務(wù)平臺(tái)上提供軟件供用戶使用,用戶只使用軟件,不掌握操作系統(tǒng)、硬件等網(wǎng)絡(luò)基礎(chǔ)架構(gòu)。用戶不必自己安裝軟件,只需要瀏覽器連接到公共的服務(wù)平臺(tái)即可。供應(yīng)商會(huì)按照用戶的要求安裝所需的軟件,并負(fù)責(zé)軟件的升級(jí)和維護(hù)。

云計(jì)算的主要優(yōu)點(diǎn):

(1)把用戶從安裝和測(cè)試軟件的工作中解脫出來(lái)。云計(jì)算平臺(tái)可以按照用戶的需求提供軟件及硬件的服務(wù)。用戶不需要考慮網(wǎng)絡(luò)下面復(fù)雜的硬件架構(gòu),僅僅需要關(guān)注計(jì)算和分析就可以。

(2)按需租用計(jì)算資源可以讓用戶支付更少的費(fèi)用。在云計(jì)算平臺(tái)上,用戶在最初時(shí)可以租用少量的機(jī)器,以后隨著需求的增加或減少相應(yīng)的增加或減少租用的機(jī)器。用戶所付的費(fèi)用就是實(shí)際租用機(jī)器的費(fèi)用。

(3)云計(jì)算方便研究人員之間的數(shù)據(jù)共享和分析。不同研究者在本地服務(wù)器上安裝的軟件版本可能不同,所以共享數(shù)據(jù)和軟件很困難。云計(jì)算可以使登錄同一個(gè)平臺(tái)的用戶共享操作系統(tǒng)和所有的軟件數(shù)據(jù),保證了軟件的版本同步更新。

2 云計(jì)算在生物信息中的應(yīng)用

我們把云計(jì)算在生物信息學(xué)中的應(yīng)用按IaaS, PaaS和SaaS三個(gè)方面分別介紹。

2.1 IaaS

用戶租用云計(jì)算上的虛擬主機(jī)可以自己控制計(jì)算、存儲(chǔ)等硬件設(shè)備,建立需要的計(jì)算環(huán)境。并且大量的生物信息學(xué)工具可以打包為虛擬鏡像用于租用的云計(jì)算的虛擬主機(jī)上,可以很方便的進(jìn)行多種數(shù)據(jù)分析。如CloVR提供的一個(gè)包含預(yù)配置和自動(dòng)的生物信息學(xué)流程的虛擬主機(jī),可以運(yùn)行在本地的計(jì)算機(jī)上也可以運(yùn)行在云計(jì)算平臺(tái)上。這個(gè)虛擬機(jī)以Ubuntu和BioLinux為基礎(chǔ),安裝了Grid Engine和Hadoop作為作業(yè)調(diào)度,Ergatis作為工作流系統(tǒng),還有很多開(kāi)源的生物信息學(xué)軟件,如BLAST、16S rRNA等。用戶也可以開(kāi)發(fā)自己的軟件運(yùn)行在虛擬機(jī)上。Bioconductor是一個(gè)開(kāi)源的關(guān)于R語(yǔ)言的生物信息學(xué)庫(kù),提供了一系列的軟件包用于微陣列數(shù)據(jù)分析。用戶可以下載Bioconductor提供的鏡像安裝到租用的云計(jì)算平臺(tái)上。

2.2 PaaS

Galaxy Cloudman和Eoulsan可以看做PaaS。Galaxy整合了一系列的簡(jiǎn)單易用的工具,提供一個(gè)簡(jiǎn)易的網(wǎng)頁(yè)用來(lái)分析數(shù)據(jù)。Galaxy Cloudman把Galaxy的軟件工具打包成一個(gè)鏡像,可以在AWS(Amazon Web Service)上應(yīng)用。用戶可以將其他安裝在Galaxy平臺(tái)上的軟件安裝到自己的云計(jì)算平臺(tái)上,甚至可以在Galaxy Cloudman上定義插件。通過(guò)添加額外的工具,可以擴(kuò)展默認(rèn)函數(shù)并測(cè)試和使用。從這個(gè)意義上說(shuō),Galaxy Cloudman可以看做PaaS。

Eoulsan整合了很多下一代基因數(shù)據(jù)分析工具,如BWA,Bowtie,SOAP2,GSNAP,edgeR,和DEdeq于一個(gè)框架內(nèi),同時(shí),它也支持用戶自己開(kāi)發(fā)的插件用于數(shù)據(jù)分析。

2.3 SaaS

很多傳統(tǒng)的生物信息學(xué)工具如BLAST、UCSC Genome Browser僅僅用一個(gè)瀏覽器就可以登錄到服務(wù)器使用相應(yīng)的服務(wù),它們也可以稱為SaaS。這些服務(wù)一般由軟件工具的開(kāi)發(fā)者提供,伸縮性很差。我們主要介紹應(yīng)用于云計(jì)算平臺(tái)上可以伸縮的生物信息學(xué)工具。

短序列(讀段)匹配是指將測(cè)序得到短序列匹配到參考基因組上,這是許多測(cè)序數(shù)據(jù)分析的第一步,如SNP識(shí)別和基因表達(dá)譜分析。CloudBurst,CloudAligner,SEAL和Crossbow都是應(yīng)用于云計(jì)算基于MapReduce的軟件,可以匹配數(shù)以百萬(wàn)計(jì)的序列。Schatz用”seed-and-extend”算法開(kāi)發(fā)的CloudBurst可以確定錯(cuò)誤匹配的數(shù)目。CloudBurst模仿了RMAP的算法,但速度提高了30倍。但是CloudBurst不支持fastq文件,并且不能處理重亞硫酸鹽測(cè)序和(雙)末端測(cè)序產(chǎn)生的數(shù)據(jù)。CloudAligner彌補(bǔ)了這個(gè)缺點(diǎn),并且比CloudBurst快35%到80%。SEAL整合了BWA,在序列匹配時(shí)可以去除重復(fù)的序列,這對(duì)SNP識(shí)別和以后分析很有用。應(yīng)用MapReduce的Crossbow整合了Bowtie和SOAPsnp,可以在幾個(gè)小時(shí)內(nèi)匹配數(shù)以十億計(jì)的序列。

差異表達(dá)分析可以用來(lái)尋找不同樣本中表達(dá)有明顯差別的基因,而RNA測(cè)序(RNA-seq)用來(lái)量化樣本中的基因表達(dá)水平。Myrna是一個(gè)云計(jì)算平臺(tái)上計(jì)算大規(guī)模RNA測(cè)序的軟件。它整合了序列匹配、歸一化、聚類分析和統(tǒng)計(jì)模型,直接輸出不同樣本的基因表達(dá)水平和不同表達(dá)水平的基因。然而,Myrna 最大的缺陷是不能正確地將短序列匹配到外顯子拼接位點(diǎn)上。但FX彌補(bǔ)了這個(gè)缺點(diǎn)。FX用改進(jìn)的匹配函數(shù)分析RNA數(shù)據(jù),以RPKM或是BPKM的格式輸出不同基因的表達(dá)水平。

3 云計(jì)算面臨的問(wèn)題

云計(jì)算提供了強(qiáng)大的計(jì)算能力,但云計(jì)算自身的特點(diǎn)也使它的發(fā)展面臨了一些困難和制約。云計(jì)算在生物信息學(xué)上的應(yīng)用尚處于初期階段,盡管已經(jīng)出現(xiàn)了一定數(shù)量的生物信息學(xué)工具,但仍有很多的分析無(wú)法完成,很多的工具還需升級(jí)或者開(kāi)發(fā)。云計(jì)算上數(shù)據(jù)的隱私性和安全性也是用戶需要考慮的方面。特別是一些生物數(shù)據(jù)涉及到病人的隱私,但很多國(guó)家還沒(méi)有保護(hù)這種數(shù)據(jù)隱私的法律。云計(jì)算服務(wù)提供商需要制定一些規(guī)則來(lái)保護(hù)用戶的數(shù)據(jù)。

4 對(duì)應(yīng)用云計(jì)算的建議

對(duì)于將要使用云計(jì)算的用戶,需要考慮以下三個(gè)方面:數(shù)據(jù)規(guī)模、安全隱私和費(fèi)用。

數(shù)據(jù)規(guī)模及安全隱私:首先要考慮你的數(shù)據(jù)規(guī)模是否超過(guò)了本地計(jì)算機(jī)的處理能力。現(xiàn)在本地的個(gè)人電腦可以處理數(shù)千兆的數(shù)據(jù),服務(wù)器一次可以處理數(shù)百G的數(shù)據(jù)。如果用戶熟悉并行計(jì)算的技術(shù),可以處理數(shù)TB的數(shù)據(jù)。但如果你的數(shù)據(jù)更大并且不精通并行計(jì)算,本地計(jì)算機(jī)和服務(wù)器就很難處理了,就可以考慮云計(jì)算。用戶如果要向云計(jì)算平臺(tái)上傳輸數(shù)據(jù),需要考慮數(shù)據(jù)的安全性和隱私性。比如涉及病人的隱私是否會(huì)泄露,云計(jì)算服務(wù)提供商是否可以保證數(shù)據(jù)的安全等。

費(fèi)用:云計(jì)算的費(fèi)用一般是按照使用的計(jì)算資源的多少和使用時(shí)間的長(zhǎng)短計(jì)算的。使用云計(jì)算前應(yīng)該評(píng)估其使用費(fèi)用。用戶應(yīng)該考慮所有階段的費(fèi)用,如數(shù)據(jù)傳輸、保存、分析等。

目前,云計(jì)算和生物信息學(xué)都處在快速發(fā)展當(dāng)中,云計(jì)算在生物信息學(xué)中的應(yīng)用也越來(lái)越廣泛和深入。特別是生物數(shù)據(jù)的大規(guī)模增漲,生物學(xué)家必須從大量的數(shù)據(jù)當(dāng)中分辨出有用的信息。這就需要強(qiáng)大的存儲(chǔ)能力和計(jì)算分析能力,云計(jì)算可以很好的解決這個(gè)問(wèn)題。 云計(jì)算和生物信息學(xué)的結(jié)合將極大的促進(jìn)生物學(xué)的發(fā)展。

參考文獻(xiàn)

[1]劉鵬主編.云計(jì)算(第二版)[M].北京:電子工業(yè)出版社,2011(05).

[2]Schatz MC,CloudBurst:Highly sensitive read mapping with MapReduce,Bioinformatics

25(11):1363-1369,2009.

[3]Nguyen T,ShiW,Ruden D,CloudAligner:A fast and full-featured mapreduce based tool.for sequence mapping, BMC Res Notes 4:171,2011.

[4]Hong D,Rhie A,Park SS,Lee J,Ju YS,Kim S,Yu SB,Bleazard T,Park HS,Rhee H,Chong H,Yang KS,Lee YS,Kim IH,Lee JS,Kim JI,Seo JS,F(xiàn)X:An RNA-seq analysis tool on the cloud, Bioinformatics 28(5):721-723,2012.

作者簡(jiǎn)介

李淵(1985-),男,河南省延津縣人。碩士研究生學(xué)歷。現(xiàn)為蘇州大學(xué)系統(tǒng)生物學(xué)研究中心助理實(shí)驗(yàn)師。主要研究方向?yàn)閷?shí)驗(yàn)技術(shù)。

第6篇

基因組信息爆炸的時(shí)代,需要超大規(guī)模計(jì)算系統(tǒng)來(lái)運(yùn)算。

伴隨著基因組研究日新月異的快速發(fā)展,相關(guān)信息出現(xiàn)了爆炸性增長(zhǎng),迫切需要對(duì)海量生物信息進(jìn)行處理。以DNA堿基數(shù)為例,其增長(zhǎng)速度呈指數(shù)性增長(zhǎng),大約每14個(gè)月就會(huì)增長(zhǎng)一倍,這種增長(zhǎng)速度只有計(jì)算機(jī)運(yùn)算能力的增長(zhǎng)可以與之相比。所以在當(dāng)前基因組信息爆炸的時(shí)代,需要建立超大規(guī)模計(jì)算系統(tǒng),用更準(zhǔn)確、更可靠的方法來(lái)分析這些數(shù)據(jù),從中獲得有用的信息是生物信息學(xué)取得成果的決定性步驟。

近日,具有萬(wàn)億次浮點(diǎn)運(yùn)算能力、基于四核處理器的聯(lián)想高性能機(jī)群――深騰1800落戶于上海交通大學(xué),承載著該校在生命科學(xué)研究領(lǐng)域的多種核心應(yīng)用軟件。上海生物信息技術(shù)研究中心主任李亦學(xué)在接受記者采訪時(shí)說(shuō): “生物與計(jì)算結(jié)合最早叫做計(jì)算生物學(xué),從要求來(lái)講,能夠進(jìn)行大規(guī)模計(jì)算即可,對(duì)單個(gè)CPU結(jié)點(diǎn)的內(nèi)存沒(méi)有多大的要求,但隨著生物學(xué)的發(fā)展,對(duì)計(jì)算機(jī)的要求變得比較復(fù)雜。一個(gè)完整的解決方案,要求對(duì)大量不同的數(shù)據(jù)庫(kù)同時(shí)進(jìn)行快速檢索,然后是數(shù)據(jù)整合,同時(shí)還要做很多并發(fā)計(jì)算,很多計(jì)算是非常耗內(nèi)存的。實(shí)際上并不一定非得要求計(jì)算能力非常高,但一定要可靠。再者,需要同時(shí)并發(fā)完成許多不同的計(jì)算。”

李亦學(xué)說(shuō),他們?cè)谶M(jìn)行生物信息計(jì)算時(shí)會(huì)同時(shí)存在幾十種不同的任務(wù),這不但需要計(jì)算機(jī)運(yùn)算速度快,還要求有很大的共享內(nèi)存。現(xiàn)代生物學(xué)為了獲得高速運(yùn)算,必須把所有的數(shù)據(jù)放在內(nèi)存中進(jìn)行操作,這樣會(huì)節(jié)省時(shí)間。如果沒(méi)有很大的共享內(nèi)存,他們的很多案例就沒(méi)有辦法做了。比如大的基因組測(cè)序數(shù)據(jù)的拼接工作,內(nèi)存要30G左右,大內(nèi)存的胖結(jié)點(diǎn)可以做到。而四核的發(fā)展,其實(shí)可以把每個(gè)結(jié)點(diǎn)共享內(nèi)存加大,在性價(jià)比方面也比較高,這種發(fā)展非常符合生物學(xué)發(fā)展對(duì)復(fù)雜生物系統(tǒng)計(jì)算性能的要求。

據(jù)介紹,深騰1800能提供每秒1.02萬(wàn)億次的雙精度浮點(diǎn)峰值運(yùn)算平臺(tái)。而此次HPC的部署總計(jì)12個(gè)計(jì)算結(jié)點(diǎn)、1個(gè)胖結(jié)點(diǎn)以及管理結(jié)點(diǎn)和存儲(chǔ)結(jié)點(diǎn),共計(jì)116個(gè)CPU內(nèi)核,附帶完備的基礎(chǔ)架構(gòu)。該方案滿足了上海交大的需求,也提升了其科研工作效率和綜合科研實(shí)力。

在高性能計(jì)算領(lǐng)域,相對(duì)于低端的PC服務(wù)器而言,機(jī)群服務(wù)器及其系統(tǒng)構(gòu)建更需要專業(yè)的應(yīng)用方案設(shè)計(jì)技術(shù)和精湛的技術(shù)服務(wù)能力,高性能計(jì)算大多用于對(duì)計(jì)算能力要求比較嚴(yán)格的行業(yè),比如說(shuō)生物信息學(xué)、材料分子學(xué)、地質(zhì)分析以及證券金融等。但是也應(yīng)該看到我國(guó)的HPC已經(jīng)有了很大的發(fā)展,中國(guó)的HPC的系統(tǒng)方案也將從標(biāo)準(zhǔn)的通用型走向更切合應(yīng)用需求特點(diǎn)的專用型。

第7篇

關(guān)鍵詞:醫(yī)學(xué)檢驗(yàn);生物信息學(xué);課程教學(xué)

近年來(lái),生物信息學(xué)在各醫(yī)藥院校越來(lái)越受到重視,多所院校相繼在研究生教學(xué)中開(kāi)設(shè)了生物信息學(xué)課程[1]。而對(duì)于醫(yī)學(xué)本科層次是否需要開(kāi)設(shè)生物信息學(xué)課程這一問(wèn)題,雖然目前各方面的觀點(diǎn)不一,但是已經(jīng)有一些院校開(kāi)始進(jìn)行嘗試。目前醫(yī)學(xué)檢驗(yàn)專業(yè)(五年制,畢業(yè)時(shí)授予醫(yī)學(xué)學(xué)士學(xué)位)已調(diào)整為醫(yī)學(xué)檢驗(yàn)技術(shù)專業(yè)(四年制,畢業(yè)時(shí)授予理學(xué)學(xué)士學(xué)位),而生物信息學(xué)作為一門新課程,在醫(yī)學(xué)檢驗(yàn)(技術(shù))專業(yè)學(xué)生培養(yǎng)中的作用正日益受到關(guān)注,逐步被某些院校選擇作為必修課或者選修課。

一、開(kāi)設(shè)課程的必要性

空前繁榮的生物醫(yī)學(xué)大數(shù)據(jù)的產(chǎn)出,及其蘊(yùn)含的重大生命奧秘的揭示,將決定現(xiàn)代生命科技和醫(yī)藥產(chǎn)業(yè)研發(fā)的高度,決定人們對(duì)疾病的認(rèn)識(shí)和掌控能力,也將對(duì)主導(dǎo)生物醫(yī)學(xué)大數(shù)據(jù)存儲(chǔ)、管理、注釋、分析全過(guò)程,解決生命密碼的關(guān)鍵手段———現(xiàn)代生物信息學(xué)技術(shù)的發(fā)展帶來(lái)前所未有的機(jī)遇和挑戰(zhàn)[2]。對(duì)于醫(yī)學(xué)專業(yè)學(xué)生而言,通過(guò)學(xué)習(xí)生物信息學(xué),從而掌握利用各種網(wǎng)絡(luò)信息資源來(lái)檢索和獲取生物信息數(shù)據(jù),并選擇和使用各種生物信息學(xué)軟件來(lái)分析數(shù)據(jù)。在當(dāng)今大數(shù)據(jù)時(shí)代,這方面的知識(shí)和技能的培養(yǎng)對(duì)于醫(yī)學(xué)生今后從事醫(yī)學(xué)科研工作是非常重要的。因此,在醫(yī)學(xué)專業(yè)學(xué)生中開(kāi)設(shè)生物信息學(xué)課程非常必要。我校從2010年開(kāi)始將生物信息學(xué)設(shè)置為研究生教學(xué)的必修課;從2013年開(kāi)始在醫(yī)學(xué)檢驗(yàn)專業(yè)中開(kāi)設(shè)生物信息學(xué)選修課,自2015年開(kāi)始轉(zhuǎn)為醫(yī)學(xué)檢驗(yàn)技術(shù)專業(yè)。在醫(yī)學(xué)檢驗(yàn)技術(shù)專業(yè)中開(kāi)設(shè)生物信息學(xué)課程,能夠?yàn)樵搶I(yè)學(xué)生的臨床和科研方面的素質(zhì)積累提供必要的支持,更重要的是增強(qiáng)了在醫(yī)學(xué)和信息科學(xué)交叉領(lǐng)域解決問(wèn)題的技能,其意義幾乎等同于在研究生教學(xué)中的設(shè)課意義。

二、教學(xué)內(nèi)容的安排

醫(yī)學(xué)檢驗(yàn)技術(shù)專業(yè)的教學(xué)任務(wù)非常緊張,幾乎將原來(lái)醫(yī)學(xué)檢驗(yàn)專業(yè)前八個(gè)學(xué)期(最后兩個(gè)學(xué)期為實(shí)習(xí)階段)課程壓縮到六個(gè)學(xué)期來(lái)完成,學(xué)生學(xué)習(xí)壓力可想而知。我校為了減輕學(xué)生負(fù)擔(dān),各課程的課時(shí)數(shù)都比醫(yī)學(xué)檢驗(yàn)專業(yè)有所減少。但生物信息學(xué)并未改變,仍然為16學(xué)時(shí)。為了在較短的學(xué)時(shí)內(nèi)實(shí)現(xiàn)教學(xué)效果的最大化,我們結(jié)合該專業(yè)學(xué)生的特點(diǎn)和需求,將授課內(nèi)容分為理論課和實(shí)踐課兩部分,實(shí)踐課不占學(xué)時(shí)。理論課主要介紹基本的生物信息學(xué)理論、資源和數(shù)據(jù)的獲取、分析方法和工具的使用;實(shí)踐課則通過(guò)布置作業(yè),課后上機(jī)操作來(lái)解決問(wèn)題。理論課主要內(nèi)容包括:生物信息學(xué)導(dǎo)論、DNA測(cè)序技術(shù)、序列的獲取、雙序列比對(duì)、多序列比對(duì)、蛋白質(zhì)結(jié)構(gòu)分析和預(yù)測(cè)共計(jì)六個(gè)專題。實(shí)踐課主要內(nèi)容包括:cDNA及基因組參考序列的獲取;常見(jiàn)序列格式的釋義與轉(zhuǎn)換;雙序列比對(duì)(局部比對(duì));多序列比對(duì)(全局比對(duì));蛋白質(zhì)綜合信息查詢;蛋白質(zhì)基本性質(zhì)、疏水區(qū)、亞細(xì)胞定位、信號(hào)肽、跨膜區(qū)、模體及結(jié)構(gòu)域分析與二級(jí)結(jié)構(gòu)預(yù)測(cè);蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)。在理論課實(shí)施過(guò)程中,注重將與生物信息學(xué)相關(guān)的生命科學(xué)和醫(yī)學(xué)前沿的一些最新進(jìn)展和最新成果引入理論知識(shí)講授中,讓學(xué)生在有限學(xué)時(shí)內(nèi)能夠進(jìn)一步認(rèn)識(shí)生物信息學(xué)的內(nèi)涵和課程的價(jià)值,追蹤前沿學(xué)科的動(dòng)態(tài),開(kāi)拓視野。

三、教學(xué)方法的設(shè)計(jì)

生物信息學(xué)涉及多個(gè)學(xué)科領(lǐng)域,交叉性強(qiáng),在較短的學(xué)時(shí)內(nèi)學(xué)好這門課程的難度很大。學(xué)生的學(xué)習(xí)興趣與教學(xué)內(nèi)容和手段關(guān)系密切,除了精心選擇教學(xué)內(nèi)容外,教學(xué)方法上也有很多需要革新乃至創(chuàng)新的地方。在教學(xué)過(guò)程中,我們形成了頗具特色的教學(xué)經(jīng)驗(yàn),由授課教師獨(dú)創(chuàng)的授課———實(shí)踐———演示(Teaching-Practicing-Showing,TPS)教學(xué)模式已應(yīng)用于教學(xué)。TPS教學(xué)模式著力于以實(shí)際問(wèn)題為引線,將理論授課與上機(jī)實(shí)踐有機(jī)地融為一體,逐步介紹生物數(shù)據(jù)分析的各項(xiàng)技能,并指導(dǎo)學(xué)生將其融會(huì)貫通以真正掌握相關(guān)的基本方法與常用工具。首先,在教學(xué)內(nèi)容上引入具體實(shí)例來(lái)進(jìn)行教學(xué),比如講解生物信息數(shù)據(jù)庫(kù)(Gene、Nucleotide、UniProt、PDB等)時(shí),通過(guò)給出檢索某個(gè)人類疾病基因數(shù)據(jù)的例子來(lái)學(xué)習(xí)數(shù)據(jù)庫(kù)的使用方法。課堂上教學(xué)實(shí)例的設(shè)計(jì)需要任課教師在備課時(shí)投入大量精力來(lái)完成,還需要教師具備多學(xué)科交叉的知識(shí)。教學(xué)實(shí)踐表明,與醫(yī)學(xué)相關(guān)的生物信息學(xué)分析實(shí)例可以讓學(xué)生更好地認(rèn)識(shí)該課程的作用,大幅度提高學(xué)生的學(xué)習(xí)興趣和學(xué)習(xí)的主動(dòng)性。此外,課堂教學(xué)手段也應(yīng)該豐富多彩,多媒體教學(xué)中可以充分使用圖片、動(dòng)畫等元素。其次,舉例分析時(shí)可以進(jìn)行一定的現(xiàn)場(chǎng)演示,比如講解檢索Unigene數(shù)據(jù)庫(kù)時(shí)可以一邊上網(wǎng)演示一邊解釋說(shuō)明。

四、考核方式的變革

生物信息學(xué)作為選修課,既要遵循學(xué)校相關(guān)的考試制度,也要通過(guò)對(duì)考試方式的變革來(lái)提高考試效果。我們將理論考核與學(xué)生的實(shí)踐能力考核聯(lián)系起來(lái),結(jié)合學(xué)生課外實(shí)踐任務(wù)的完成情況和開(kāi)卷考試成績(jī)進(jìn)行綜合評(píng)定。在課程中安排一次課外實(shí)踐任務(wù),要求每位學(xué)生獨(dú)立完成相關(guān)分析并提交書面分析報(bào)告,該部分占考核成績(jī)的20%。具體內(nèi)容為自行選擇一個(gè)人類細(xì)胞外功能蛋白:1.利用ClustalX對(duì)各物種參考蛋白序列進(jìn)行多序列比對(duì)(輸出PS格式結(jié)果);2.分析分子量、等電點(diǎn)、分子式、穩(wěn)定性、親疏水性及亞細(xì)胞定位;3.預(yù)測(cè)二級(jí)結(jié)構(gòu)并模擬三維結(jié)構(gòu)。課程結(jié)束后進(jìn)行開(kāi)卷考試,內(nèi)容包括基礎(chǔ)知識(shí)和綜合分析,盡量采取靈活的出題方式,并控制題量,該部分占考核成績(jī)的80%。近年來(lái)的教學(xué)實(shí)踐表明,這種綜合評(píng)定的方式能夠反映學(xué)生對(duì)該課程的掌握程度,體現(xiàn)學(xué)生利用生物信息學(xué)知識(shí)解決問(wèn)題的能力。

五、展望

實(shí)踐表明,生物信息學(xué)課程教學(xué)能夠給學(xué)生提供所需要的生物信息學(xué)知識(shí)和技能,但是在教學(xué)內(nèi)容安排、教學(xué)方法設(shè)計(jì)、教學(xué)手段使用和教學(xué)效果評(píng)價(jià)等諸多環(huán)節(jié)都需要進(jìn)一步探討。在這個(gè)過(guò)程中,我們既需要吸收傳統(tǒng)教學(xué)模式中的優(yōu)點(diǎn)和精髓,做到嚴(yán)謹(jǐn)和切合實(shí)際,又需要更新教學(xué)理念,突出醫(yī)學(xué)特色,大膽嘗試新的教學(xué)方法和手段,最終形成本課程別具一格的教學(xué)特色。

作者:倫永志 單位:大連大學(xué)

參考文獻(xiàn)

第8篇

關(guān)鍵詞:生物信息學(xué);形成性評(píng)價(jià);教育教學(xué)改革

中圖分類號(hào):G642.4 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2014)22-0147-02

生物信息學(xué)(Bioinformatics)是近二十年來(lái)迅速發(fā)展起來(lái)的一門新興前沿學(xué)科,它綜合利用計(jì)算機(jī)科學(xué)和信息技術(shù),通過(guò)對(duì)海量生物學(xué)數(shù)據(jù)的處理和分析,揭示其中蘊(yùn)藏的內(nèi)在聯(lián)系和生物學(xué)含義,進(jìn)而提煉有用的生物學(xué)知識(shí)。隨著人類基因組和多種模式生物測(cè)序的完成,有關(guān)核酸、蛋白序列和結(jié)構(gòu)的數(shù)據(jù)呈指數(shù)增長(zhǎng),面對(duì)如此龐大而復(fù)雜的數(shù)據(jù)資源,運(yùn)用計(jì)算機(jī)獲取管理分析數(shù)據(jù)、控制分析誤差、加速分析過(guò)程勢(shì)在必行,生物信息學(xué)應(yīng)運(yùn)而生并迅速蓬勃發(fā)展起來(lái),并逐步成為生命科學(xué)在信息時(shí)展的核心內(nèi)容之一,對(duì)生命科學(xué)研究帶來(lái)革命性變革。受到國(guó)際大環(huán)境的影響,國(guó)內(nèi)各重點(diǎn)大學(xué)紛紛開(kāi)展了生物信息學(xué)專業(yè)的設(shè)立,一般醫(yī)學(xué)院校也開(kāi)展了生物信息學(xué)必修及選修課課程,由于生物信息學(xué)是新興學(xué)科,在教學(xué)現(xiàn)狀上存在很多不足,如:教學(xué)手段落后;只注重理論教學(xué),忽視理論應(yīng)用于實(shí)踐的重要性,導(dǎo)致學(xué)生所學(xué)的理論知識(shí)與實(shí)際工作脫節(jié);教學(xué)內(nèi)容簡(jiǎn)單,體系不完整,完成課程后學(xué)生不能將所學(xué)知識(shí)融會(huì)貫通;不注重培養(yǎng)學(xué)生的整體生物信息學(xué)思維。如何提高生物信息學(xué)課程的教學(xué)質(zhì)量是教育教學(xué)改革的重要內(nèi)容。

一、生物信息學(xué)的教學(xué)特點(diǎn)

1.是多學(xué)科、綜合交叉的產(chǎn)物。生物信息學(xué)是一門由計(jì)算機(jī)技術(shù)、數(shù)學(xué)、生物醫(yī)學(xué)多學(xué)科綜合交叉的新興學(xué)科,對(duì)本課程的學(xué)習(xí),除了要求掌握獲取和利用大量生物數(shù)據(jù)信息的基本知識(shí)和技術(shù)外,還要求掌握相關(guān)的數(shù)學(xué)、物理學(xué)、計(jì)算機(jī)程序設(shè)計(jì)、分子生物學(xué)等醫(yī)學(xué)基礎(chǔ)知識(shí)相關(guān)的知識(shí)和技術(shù),培養(yǎng)的是復(fù)合型、交叉型人才。

2.數(shù)據(jù)、信息量龐雜,發(fā)展迅速。目前生物信息數(shù)據(jù)處于高速的實(shí)時(shí)更新中,數(shù)據(jù)類型和內(nèi)容相當(dāng)豐富,同時(shí)亦包含大量的冗余及錯(cuò)誤數(shù)據(jù),僅GenBank數(shù)據(jù)庫(kù)就包含了來(lái)源于十多萬(wàn)個(gè)物種的數(shù)據(jù),除了人類還包括小鼠、擬南芥、水稻、斑馬魚、果蠅等模式生物及原核生物、病毒等數(shù)據(jù)。近十年來(lái),核酸堿基數(shù)目大約每14個(gè)月就翻一倍,2014年1月2日,在Nucleotide數(shù)據(jù)庫(kù)中輸入Human,就可以獲取30 942 725條數(shù)據(jù),而兩年前這數(shù)字僅為14 617 064。面對(duì)這么龐雜的海量數(shù)據(jù),教學(xué)內(nèi)容必須圍繞方式、方法來(lái)展開(kāi)。

3.教學(xué)及課后學(xué)習(xí)應(yīng)用必須在網(wǎng)絡(luò)環(huán)境中進(jìn)行。海量的數(shù)據(jù)均存儲(chǔ)在網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)庫(kù)中,信息的獲取、分析和處理都必須通過(guò)Internet網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)。因此教學(xué)活動(dòng)亦必須圍繞網(wǎng)絡(luò)環(huán)境展開(kāi),利用網(wǎng)絡(luò),傳授學(xué)生獲取數(shù)據(jù)信息并開(kāi)發(fā)和利用的技能,強(qiáng)化操作訓(xùn)練,增強(qiáng)學(xué)生分析解決問(wèn)題的能力。綜合來(lái)說(shuō),生物信息學(xué)的教學(xué)內(nèi)容豐富,教學(xué)方法多樣,考核評(píng)價(jià)及教學(xué)效果反饋復(fù)雜,因此,傳統(tǒng)的學(xué)習(xí)評(píng)價(jià)不能適應(yīng)生物信息學(xué)教學(xué)的發(fā)展。

二、形成性評(píng)價(jià)的內(nèi)涵

形成性評(píng)價(jià)(Formative assecssment)是1967年由美國(guó)的評(píng)價(jià)學(xué)專家斯克里芬(M. Scriven)提出的,后被美國(guó)的教育學(xué)家布盧姆(B.S.Bloom)應(yīng)用于教學(xué)領(lǐng)域。指在教育活動(dòng)中,即學(xué)生知識(shí)、技能及態(tài)度的形成過(guò)程中檢測(cè)學(xué)生的進(jìn)步,監(jiān)控學(xué)生知識(shí)與技能的獲得,評(píng)價(jià)學(xué)生的學(xué)習(xí)進(jìn)展情況,最終通過(guò)反饋來(lái)調(diào)整教學(xué)以提高教學(xué)質(zhì)量。形成性評(píng)價(jià)是在教學(xué)過(guò)程中為了獲得有關(guān)教學(xué)的反饋信息,改進(jìn)教學(xué),使學(xué)生知識(shí)達(dá)到的掌握程度所進(jìn)行的系統(tǒng)性評(píng)價(jià)。

三、形成性評(píng)價(jià)應(yīng)用于生物信息學(xué)的優(yōu)勢(shì)

形成性評(píng)價(jià)強(qiáng)調(diào)的是對(duì)教和學(xué)過(guò)程進(jìn)行多層次、多元化的分析和判斷,促進(jìn)教和學(xué)過(guò)程的完善和發(fā)展,同時(shí),形成性評(píng)價(jià)還強(qiáng)調(diào)對(duì)學(xué)生的學(xué)習(xí)過(guò)程進(jìn)行評(píng)價(jià),它不僅從評(píng)價(jià)者的需要出發(fā),更注重從被評(píng)價(jià)者的需要出發(fā),重視學(xué)生在學(xué)習(xí)中的體驗(yàn),重視師生間的交流,使學(xué)生在評(píng)價(jià)中能正確了解自我、完善自我,利于培養(yǎng)學(xué)生的自主學(xué)習(xí)能力。

1.評(píng)價(jià)貫穿整個(gè)學(xué)習(xí)過(guò)程,符合生物信息學(xué)內(nèi)容的復(fù)雜性。生物信息學(xué)內(nèi)容豐富、龐雜,更新快,傳統(tǒng)的終結(jié)性評(píng)價(jià)只考察學(xué)生掌握的部分內(nèi)容,因此評(píng)價(jià)過(guò)于片面,而形成性評(píng)價(jià)貫穿在學(xué)生學(xué)習(xí)的整個(gè)過(guò)程,對(duì)學(xué)生日常學(xué)習(xí)過(guò)程的表現(xiàn)、所取得的成績(jī)及所反映的情感、態(tài)度、學(xué)習(xí)策略等方面做出評(píng)價(jià),更符合生物信息學(xué)的教學(xué)工作。

2.評(píng)價(jià)主體更加多元,激發(fā)學(xué)生學(xué)習(xí)主動(dòng)性,有益于生物信息學(xué)技術(shù)的自主學(xué)習(xí)。傳統(tǒng)的終結(jié)性評(píng)價(jià)主要是教師對(duì)學(xué)生的評(píng)價(jià),學(xué)生往往處于被動(dòng)狀態(tài),無(wú)法激發(fā)其學(xué)習(xí)興趣。形成性評(píng)價(jià)則強(qiáng)調(diào)學(xué)生的主動(dòng)參與,使學(xué)生成為積極評(píng)價(jià)的主體,加強(qiáng)評(píng)價(jià)者與被評(píng)價(jià)者之間的互動(dòng),鼓勵(lì)學(xué)生自我評(píng)價(jià)與同學(xué)間互評(píng),促使他們不斷回顧和反思自己的學(xué)習(xí)過(guò)程及方法,從而進(jìn)一步培養(yǎng)學(xué)生學(xué)習(xí)的主動(dòng)性與積極性。這點(diǎn)與生物信息學(xué)課程的教學(xué)方法多樣性不謀而合,激發(fā)學(xué)生的自主學(xué)習(xí)、多方法、多手段綜合運(yùn)用的能力。

3.評(píng)價(jià)結(jié)果更全面,更符合生物信息學(xué)教學(xué)目標(biāo)。終結(jié)性評(píng)價(jià)常以一次或少數(shù)幾次測(cè)試來(lái)批判,重知識(shí)輕能力,重片面的知識(shí)結(jié)果輕學(xué)習(xí)過(guò)程,而形成性評(píng)價(jià)的內(nèi)容貫穿整個(gè)教與學(xué)的過(guò)程,不僅注重學(xué)生對(duì)知識(shí)的掌握情況,而且也重視評(píng)價(jià)學(xué)生的學(xué)習(xí)態(tài)度、策略及情感因素,因此更全面更科學(xué)。

4.評(píng)價(jià)結(jié)果的反饋?zhàn)饔酶嗅槍?duì)性,有利于及時(shí)調(diào)整教學(xué)方法。形成性評(píng)價(jià)能及時(shí)準(zhǔn)確地反映學(xué)生在一定階段的學(xué)習(xí)情況,給學(xué)生及教師提供及時(shí)的反饋,更有針對(duì)性地幫助學(xué)生建立自信心,激發(fā)和培養(yǎng)學(xué)生的學(xué)習(xí)興趣及良好的學(xué)習(xí)習(xí)慣,同時(shí)可以使教師及時(shí)了解學(xué)生的學(xué)習(xí)情況和需要,以便調(diào)整教學(xué)內(nèi)容,改進(jìn)教學(xué)方法,從而提高教學(xué)效果。

四、形成性評(píng)價(jià)在生物信息學(xué)教學(xué)中的應(yīng)用策略

1.統(tǒng)一規(guī)劃,制定綜合評(píng)價(jià)方案。開(kāi)課之初,制定詳細(xì)的學(xué)習(xí)評(píng)價(jià)體系,將該學(xué)期的學(xué)習(xí)教學(xué)大綱及課程進(jìn)度表發(fā)給每一位同學(xué),由學(xué)生及教師共同參與制定學(xué)習(xí)計(jì)劃及學(xué)習(xí)評(píng)價(jià)表,每一部分分別由教師評(píng)價(jià)、學(xué)生自評(píng)、和小組同學(xué)互評(píng)三項(xiàng)構(gòu)成。教師需事先給出評(píng)價(jià)范例和評(píng)估標(biāo)準(zhǔn),對(duì)標(biāo)準(zhǔn)進(jìn)行合理的描述和解釋,以便學(xué)生對(duì)照?qǐng)?zhí)行。在每次自評(píng)及互評(píng)后,教師應(yīng)利用E-mail及QQ等在線工具及時(shí)的將結(jié)果反饋,指出評(píng)價(jià)過(guò)程中的問(wèn)題及改進(jìn)的意見(jiàn)。評(píng)價(jià)方案獲得學(xué)生的認(rèn)可方能使學(xué)生樂(lè)于參與,樂(lè)于反思和改進(jìn)自我,并在評(píng)價(jià)中體驗(yàn)成功和快樂(lè)。

2.建立學(xué)習(xí)及評(píng)價(jià)小組。生物信息學(xué)的學(xué)習(xí)方法、獲取數(shù)據(jù)信息的手段很多,學(xué)習(xí)小組的成立有利于在學(xué)習(xí)過(guò)程中及時(shí)交流、相互學(xué)習(xí)促進(jìn)和共同解決問(wèn)題,小組成員間相互更為了解,可以開(kāi)展課堂學(xué)習(xí)及課外自主學(xué)習(xí)的監(jiān)控和評(píng)估,并保證學(xué)生互評(píng)環(huán)節(jié)的順利開(kāi)展。每次互評(píng)將根據(jù)參與程度、合作行為、知識(shí)掌握程度等記錄在冊(cè),教師亦應(yīng)關(guān)注和指導(dǎo)小組評(píng)價(jià)工作的開(kāi)展,并及時(shí)做好小組成員間的協(xié)調(diào)工作。

3.建立學(xué)生學(xué)習(xí)檔案。生物信息學(xué)課程基本都依賴網(wǎng)絡(luò)來(lái)完成,每次課堂學(xué)習(xí)后練習(xí)、學(xué)生間討論及學(xué)生自評(píng)互評(píng)等都以電子檔案的形式保存,可以包括文字、圖片、聲音、視頻等。學(xué)習(xí)檔案體現(xiàn)了學(xué)生的整個(gè)學(xué)習(xí)過(guò)程,展示學(xué)生努力學(xué)習(xí)后所取得的進(jìn)步和成績(jī),也客觀地反映學(xué)生的不足,有利于學(xué)生形成自我反思和自我評(píng)估,有助于培養(yǎng)獨(dú)立的自我學(xué)習(xí)習(xí)慣,增強(qiáng)參與感和學(xué)習(xí)積極性。

4.綜合成績(jī)?cè)u(píng)定。在學(xué)期末,根據(jù)學(xué)生學(xué)習(xí)的全過(guò)程,將對(duì)學(xué)生學(xué)習(xí)狀態(tài)的監(jiān)控納入最后的成績(jī)?cè)u(píng)定,制定合理的比例方案,用綜合成績(jī)?cè)u(píng)定取代單一的終結(jié)行評(píng)定方法,更全面的評(píng)價(jià)學(xué)生。

綜上所述,形成性評(píng)價(jià)體系更適應(yīng)生物信息學(xué)教學(xué)特點(diǎn),有傳統(tǒng)評(píng)價(jià)無(wú)法比擬的優(yōu)點(diǎn),但同時(shí)增加了教師的工作量,無(wú)形中實(shí)施難度亦加大。為了更好地實(shí)施形成性評(píng)價(jià),首先應(yīng)明確的是,這不是教師個(gè)人的問(wèn)題,學(xué)校、院系及各部門均應(yīng)統(tǒng)一認(rèn)識(shí),建立從上而下的評(píng)價(jià)機(jī)制和比較完善的教學(xué)管理及學(xué)分管理制度。其次,健全教師參與形成性評(píng)價(jià)的激勵(lì)制度,解決教師業(yè)績(jī)考核等制約形成性評(píng)價(jià)實(shí)施的因素,建立具體的獎(jiǎng)勵(lì)制度使教師自覺(jué)納入形成性評(píng)價(jià),優(yōu)化課題教學(xué)模式。最后,鼓勵(lì)教師以團(tuán)隊(duì)形式參與形成性評(píng)價(jià)教學(xué)改革,分享教學(xué)經(jīng)驗(yàn),探討教學(xué)問(wèn)題,進(jìn)一步提高教學(xué)效果。

參考文獻(xiàn):

[1]石曉衛(wèi),李永海.淺議高校生物信息學(xué)教學(xué)改革[J].科技信息,2011,(8):89-89.

[2]胡建平,楊彩萍.生物信息學(xué)教學(xué)內(nèi)容改革研究[J].安徽農(nóng)學(xué)通報(bào).2012,18(15):173-175.

[3]謝娜.論形成性評(píng)價(jià)在大學(xué)英語(yǔ)教學(xué)中的應(yīng)用[J].國(guó)家教育行政學(xué)院學(xué)報(bào),2010,(7):74-77.

[4]駱巧麗.網(wǎng)絡(luò)教學(xué)模式下大學(xué)英語(yǔ)教學(xué)評(píng)價(jià)體系的構(gòu)建[J].四川教育學(xué)院學(xué)報(bào),2010,26(3):95-98.

第9篇

>> 人組蛋白去乙酰化酶11的克隆表達(dá)與生物信息學(xué)分析 FZ6基因及其蛋白的生物信息學(xué)分析 擬南芥和大白菜YABBY蛋白家族的生物信息學(xué)分析 斑馬魚TATA結(jié)合蛋白的生物信息學(xué)分析 黃瓜DVR基因的生物信息學(xué)分析 金鐵鎖糖基轉(zhuǎn)移酶PtT1的克隆與生物信息學(xué)分析 黃芩葡萄糖醛酸水解酶基因的克隆、生物信息學(xué)分析及表達(dá) 蓖麻油體固醇蛋白質(zhì)的鑒定與生物信息學(xué)分析 結(jié)核分枝桿菌38kDa蛋白結(jié)構(gòu)與功能的生物信息學(xué)分析 新疆細(xì)粒棘球絳蟲EgAgB8/3蛋白的生物信息學(xué)分析及意義 棉鈴蟲的巧防技術(shù) 太子參分解代謝關(guān)鍵酶8′羥化酶基因的克隆及生物信息學(xué)分析 紅白忍冬SABATH甲基轉(zhuǎn)移酶基因克隆及其生物信息學(xué)分析 希金斯炭疽菌腺苷酸環(huán)化酶生物信息學(xué)分析 丹參類貝殼杉烯氧化酶(SmKOL)基因全長(zhǎng)克隆及其生物信息學(xué)分析 唇形科植物腳6基腳6基焦磷酸合酶編碼基因及其氨基酸序列的生物信息學(xué)分析 人ALK-1近端啟動(dòng)子的生物信息學(xué)分析 酵母轉(zhuǎn)錄因子結(jié)合位點(diǎn)保守性的生物信息學(xué)分析 玉米谷胱甘肽過(guò)氧化物酶的生物信息學(xué)分析 歐文氏桿菌鐵代謝相關(guān)基因的生物信息學(xué)分析 常見(jiàn)問(wèn)題解答 當(dāng)前所在位置:l)分析棉鈴蟲類胰蛋白酶氨基酸序列的理化性質(zhì);運(yùn)用DNAMAN軟件比對(duì)分析氨基酸序列同源性;運(yùn)用MEGA 5.0中的Fhylogenetic Tree方法構(gòu)建分子系統(tǒng)發(fā)育樹(shù);運(yùn)用在線工具ProtScale ()進(jìn)行親、疏水性的分析;運(yùn)用Psort在線工具()進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)的分析預(yù)測(cè);運(yùn)用NCBI數(shù)據(jù)庫(kù)中CDD在線工具(http://ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進(jìn)行功能結(jié)構(gòu)域的分析。

2 結(jié)果與分析

2.1 棉鈴蟲類胰蛋白酶氨基酸序列理化性質(zhì)分析

運(yùn)用ProtParam在線軟件分析棉鈴蟲7種類胰蛋白酶氨基酸序列理化性質(zhì),結(jié)果見(jiàn)表1。由表1可知,棉鈴蟲7種類胰蛋白酶在理論等電點(diǎn)、脂溶指數(shù)以及氨基酸組成等方面均表現(xiàn)出相似性。其相對(duì)分子質(zhì)量約為70 000,等電點(diǎn)約為5.00,氨基酸數(shù)目為253~256,Ala、Cys、Gly和Thr殘基含量較高。7種類胰蛋白酶的不穩(wěn)定系數(shù)均較高,其中類胰蛋白酶Ⅲ的不穩(wěn)定指數(shù)最低,為52.08,表明類胰蛋白酶在棉鈴蟲細(xì)胞內(nèi)的穩(wěn)定性較差,推測(cè)類胰蛋白酶代謝較為活躍,代謝周轉(zhuǎn)的速度較快。棉鈴蟲7種類胰蛋白酶的脂溶指數(shù)均較低,屬于親水性蛋白質(zhì)。

2.2 棉鈴蟲類胰蛋白酶氨基酸序列磷酸化位點(diǎn)預(yù)測(cè)分析

使用NetPhosk 2.0 Server在線工具對(duì)棉鈴蟲7種類胰蛋白酶的氨基酸序列分別進(jìn)行預(yù)測(cè)Ser、Thr與Tyr位點(diǎn)處發(fā)生磷酸化的概率結(jié)果見(jiàn)表2。從表2可見(jiàn),在氨基酸磷酸化位點(diǎn)中Ser的預(yù)測(cè)分值最高,表明Ser發(fā)生磷酸化的概率最高,并且發(fā)現(xiàn)類胰蛋白酶Ⅲ中不具有Thr磷酸化位點(diǎn);只有類胰蛋白酶Ⅴ具有Tyr磷酸化位點(diǎn)。以類胰蛋白酶Ⅲ為例進(jìn)行說(shuō)明:其氨基酸序列在第83位、243位、246位、247位這4個(gè)Ser位點(diǎn)處都有可能發(fā)生磷酸化,但第247位Ser發(fā)生磷酸化的概率最大,為M3=0.973。

2.3 棉鈴蟲類胰蛋白酶氨基酸序列分子進(jìn)化樹(shù)分析

使用MEGA 5.0中的Fhylogenetic Tree方法構(gòu)建分子系統(tǒng)發(fā)育樹(shù)結(jié)果見(jiàn)圖1。由圖1可知,7種類胰蛋白酶分為兩個(gè)分支,類胰蛋白酶Ⅰ、Ⅱ、Ⅶ與Ⅴ處于一個(gè)分支,類胰蛋白酶Ⅳ、Ⅲ與Ⅵ處于另一個(gè)分支。其中,類胰蛋白酶Ⅰ和類胰蛋白酶Ⅱ進(jìn)化關(guān)系較近,類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進(jìn)化關(guān)系較近。

2.4 棉鈴蟲類胰蛋白酶的氨基酸序列分析

1)使用TMHMM 2.0在線工具對(duì)7種類胰蛋白酶的氨基酸序列跨膜結(jié)構(gòu)進(jìn)行預(yù)測(cè)分析,均不存在跨膜結(jié)構(gòu)域。

2)使用ProtScale工具對(duì)7種蛋白酶的親、疏水性進(jìn)行分析。7種類胰蛋白酶的總平均親水性為0.860~0.960,均表現(xiàn)為親水性。其中,多肽鏈靠近N末端區(qū)域親水性最強(qiáng),最低分值為-0.500到-0.600,而C末端區(qū)域疏水性最強(qiáng),最高分值為2.100到2.300。

3)用DNAMAN軟件比對(duì)分析7種類胰蛋白酶的氨基酸序列同源性(圖2)。在這7種蛋白酶氨基酸序列中,有較多保守的區(qū)域(如圖2中深顏色區(qū)域所示)。經(jīng)過(guò)分析發(fā)現(xiàn),7種類胰蛋白酶氨基酸序列結(jié)構(gòu)相似,同源性最高為85.71%。7種類胰蛋白酶中均含有高度保守的必需氨基酸殘基,參與維持蛋白酶的空間結(jié)構(gòu)及行使催化功能。比如第10、54、70、179、196、207與231位的Cys殘基,它們之間能夠形成二硫鍵以穩(wěn)定蛋白酶的空間結(jié)構(gòu)。第205位的Asp殘基與228、238位的Gly殘基能夠與底物形成離子鍵、氫鍵,參與類胰蛋白酶對(duì)底物的識(shí)別與結(jié)合。第69位的His殘基、114位的Asp殘基與211位的Ser殘基組成了類胰蛋白酶的催化基團(tuán),通過(guò)電子的傳遞,與底物分子中的Arg和(或)Lys殘基羧基端肽鍵發(fā)生親核反應(yīng),實(shí)現(xiàn)催化功能(氨基酸殘基位置以類胰蛋白酶Ⅲ為準(zhǔn))。

2.5 棉鈴蟲類胰蛋白酶的功能結(jié)構(gòu)域分析

使用NCBI數(shù)據(jù)庫(kù)中CDD在線工具對(duì)類胰蛋白酶Ⅲ進(jìn)行功能結(jié)構(gòu)域分析(圖3)。結(jié)果表明,類胰蛋白酶Ⅲ屬于胰蛋白酶超家族,具有該家族特有的功能區(qū)域。類胰蛋白酶Ⅲ的16位(Ala)與17位(Arg)氨基酸殘基之間含有一個(gè)自剪切位點(diǎn)(Cleavage site),該位點(diǎn)與酶翻譯后的活化及轉(zhuǎn)運(yùn)有關(guān);69(His)位、114(Asp)位、211(Ser)位氨基酸殘基構(gòu)成酶的催化位點(diǎn)(Active site);205(Asp)位、228(Gly)位、238(Gly)位氨基酸殘基形成3個(gè)底物結(jié)合位點(diǎn)(Substrate binding sites),參與酶對(duì)底物的識(shí)別與結(jié)合,其他類胰蛋白酶的分析也得到相似的結(jié)果。

2.6 棉鈴蟲類胰蛋白酶的亞細(xì)胞定位分析

亞細(xì)胞定位預(yù)測(cè)結(jié)果見(jiàn)表3。由表3可以看出,類胰蛋白酶Ⅰ、Ⅱ主要位于內(nèi)質(zhì)網(wǎng)中,類胰蛋白酶Ⅲ主要位于內(nèi)質(zhì)網(wǎng)、液泡及細(xì)胞外基質(zhì)中,而類胰白酶Ⅳ、Ⅴ、Ⅵ與Ⅶ主要位于細(xì)胞外基質(zhì)中。亞細(xì)胞定位的多樣性體現(xiàn)了類胰蛋白酶在棉鈴蟲生命活動(dòng)過(guò)程中具有多樣性的生物學(xué)功能,其中類胰白酶Ⅲ、Ⅳ、Ⅴ、Ⅵ與Ⅶ主要發(fā)揮消化作用,因?yàn)槊掴徬x對(duì)食物的消化場(chǎng)所主要位于中腸(細(xì)胞外)。而類胰蛋白酶Ⅰ、Ⅱ與Ⅲ可能主要行使免疫保護(hù)作用,參與棉鈴蟲對(duì)外界環(huán)境的免疫應(yīng)答。

2.7 棉鈴蟲類胰蛋白酶的二級(jí)結(jié)構(gòu)分析預(yù)測(cè)

利用NPSA在線工具預(yù)測(cè)類胰蛋白酶的二級(jí)結(jié)構(gòu)(表4)。由表4可知,無(wú)規(guī)卷曲是該類胰蛋白酶整體結(jié)構(gòu)中的主要組成結(jié)構(gòu)元件,β轉(zhuǎn)角出現(xiàn)概率相對(duì)較小。α螺旋主要分布于氨基酸序列兩側(cè),而無(wú)規(guī)卷曲、延伸鏈則主要分布在多肽鏈中間區(qū)段。

3 小結(jié)與討論

本研究以棉鈴蟲腸道內(nèi)7種類胰蛋白酶為研究對(duì)象,運(yùn)用在線工具對(duì)其進(jìn)行生物信息學(xué)分析。結(jié)果表明,7種類胰蛋白酶理化性質(zhì)較為相似,為親水性蛋白酶。Ser是類胰蛋白酶序列中磷酸化概率最大的氨基酸殘基。分子系統(tǒng)發(fā)育樹(shù)結(jié)果顯示類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進(jìn)化關(guān)系較近,而類胰蛋白酶I和類胰蛋白酶Ⅱ在進(jìn)化關(guān)系上更為接近。類胰蛋白酶不存在跨膜結(jié)構(gòu)域,屬于基質(zhì)類蛋白,這與其親水性的特點(diǎn)吻合。功能結(jié)構(gòu)域分析發(fā)現(xiàn)類胰蛋白酶屬于胰蛋白酶超家族,其氨基酸序列中含有自切割位點(diǎn)、若干催化殘基與結(jié)合殘基。類胰蛋白酶的亞細(xì)胞定位具有多樣性,主要分布在細(xì)胞外與內(nèi)質(zhì)網(wǎng)中,這體現(xiàn)了類胰蛋白酶在棉鈴蟲生命活動(dòng)過(guò)程中具有多樣性的生物學(xué)功能。二級(jí)結(jié)構(gòu)分析預(yù)測(cè)表明無(wú)規(guī)卷曲在該類胰蛋白酶整體結(jié)構(gòu)中所占比例最大,是其主要的結(jié)構(gòu)元件。氨基酸序列同源性分析,7種類胰蛋白酶氨基酸序列的同源性較高,達(dá)到了85.71%,并且含有高度保守的必需殘基,參與維持蛋白酶的空間結(jié)構(gòu)及行使催化功能,包括維持高級(jí)結(jié)構(gòu)的Cys殘基,形成底物結(jié)合口袋的結(jié)合殘基及參與催化作用的催化殘基。依據(jù)此研究結(jié)果,能夠設(shè)計(jì)出與類胰蛋白酶活性中心特異性結(jié)合的抑制劑,抑制其活性,從而擾亂棉鈴蟲的正常消化,實(shí)現(xiàn)抗蟲目的。

參考文獻(xiàn):

[1] 常團(tuán)結(jié),陳 蕾,路子顯,等. 棉鈴蟲幼蟲中腸類胰蛋白酶基因的克隆及在大腸桿菌中的表達(dá)[J]. 動(dòng)物學(xué)報(bào),2002,48(6):790-796.

[2] 任曉霞,韓召軍,王蔭長(zhǎng). 棉鈴蟲乙酰膽堿酯酶cDN段的克隆和序列分析[J]. 動(dòng)物學(xué)報(bào),2002,48(1):121-124.

[3] 郭線茹,蔣金煒,羅梅浩,等. 轉(zhuǎn)基因抗蟲煙草研究進(jìn)展[J]. 昆蟲知識(shí),2005,42(4):358-363.

[4] CHOUGULE N P, GIRI A P,SAINANI M N, et al. Gene expression patterns of Helicoverpa armigera gut proteases[J]. Insect Biochemistry and Molecular Biology,2005,35(4):355-367.

[5] KANG Z, JIANG J H, WANG D, et al. Kunitz-type trypsin inhibitor with high stability from Spinacia oleracea L. seeds[J]. Biochemistry (Moscow),2009,74(1):102-109.

[6] TELANG M A, GIRI A P, SAINANI M N, et al. Characterization of two midgut proteinases of Helicoverpa armigera and their interaction with proteinase inhibitors[J]. Journal of Insect Physiology,2005,51(5):513-522.

[7] TAMHANE V A, CHOUGULE N P, GIRI A P, et al. In vivo and in vitro effect of Capsicum annum proteinase inhibitors on Helicoverpa armigera gut proteinases[J]. Biochim Biophys Acta,2005,1772(2):156-167.

[8] BOWN D P, GATEHOUSE J A. Characterization of a digestive carboxypeptidase from the insect pest corn earworm (Helicoverpa armigera) with novel specificity towards C-terminal glutamate residues[J]. European Journal of Biochemistry,2004, 271(10):2000-2011.

第10篇

關(guān)鍵詞 高叢越桔;UFGT;電子克隆;生物信息學(xué)

中圖分類號(hào) S662.2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1007-5739(2017)06-0081-04

Analysis on Insilico Cloning and Bioinformatics of Vaccinium corymbosum UFGT Gene

XIN Xiao-juan 1 MA Wei 2 * LI Yu-cheng 3

(1 Daxing′ anling Academy of Agriculture and Forestry in Heilongjiang Province,Daxing′ anling Heilongjiang 165000; 2 Heilongjiang University of Chinese Medicine; 3 Daxing′ anling Forestry Administration)

Abstract [Objective]Using electronic cloning technology to predict UFGT gene of Vaccinium corymbosum.[Methods]Taking Vaccinium uliginosum UFGT sequence as the probe sequence,based on EST sequence from NCBI and assembled by CAP3 sequence assembly programme,using bioinformatics database and related software to predict the structure and function analysis.[Results]The full length of UFGT gene was 1 789 bp and it contained a 1 161 bp ORF,encoding 386 amino acid and the protein is a hydrophilic protein.[Conclusion]The study can provide theoretical and experi-mental basis for further explain of molecular genetic function.

Key words Vaccinium corymbosum;UFGT;insilico cloning;bioinformatics

高叢越桔(Vaccinium corymbosum)原產(chǎn)地為北美,是杜鵑花科(Ericaceae)越桔屬(Vaccinium)木本植物,比^適合在中國(guó)北方地區(qū)栽培,是經(jīng)濟(jì)價(jià)值最高的優(yōu)良品種,因其果實(shí)大、品質(zhì)佳、口感好深受人們青睞[1]。

類酮類化合物在高等植物界分布廣泛,可以參與花、葉片及果實(shí)等顏色的形成,還具有抗炎、抗癌、抗氧化和保護(hù)心腦血管系統(tǒng)等多種藥理作用[2]。植物中的類黃酮-3-O-葡萄糖基轉(zhuǎn)移酶(UFGT)處于類黃酮合成途徑中,形成各種花色苷[3]。目前,科研人員已在葡萄、玉米、水稻、草莓、荔枝等植物上對(duì)UFGT基因進(jìn)行了分析研究[4-5]。

電子克隆是一種基因克隆方法,具有高效、快速、投入低,并可以為實(shí)驗(yàn)克隆提供精準(zhǔn)的參考序列等優(yōu)點(diǎn)[6-8]。

本研究基于電子克隆技術(shù),對(duì)預(yù)測(cè)的高叢越桔的UFGT基因進(jìn)行序列分析,從理化性質(zhì)、亞細(xì)胞定位、氨基酸組成、信號(hào)肽、跨膜結(jié)構(gòu)域等方面對(duì)該基因編碼的蛋白進(jìn)行了預(yù)測(cè),以期為進(jìn)一步解釋基因的分子功能奠定理論及實(shí)驗(yàn)基礎(chǔ)。

1 材料與方法

1.1 電子克隆獲得新基因序列

以篤斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)作為探針,使用Blastn工具檢索NCBI中與探針序列同源性較高的高叢越桔EST序列,使用在線工具CAP3[9]進(jìn)行拼接,以拼接好的重疊群(Contig)為探針,再次Blast檢索,如此反復(fù)。

1.2 生物信息學(xué)分析

對(duì)預(yù)測(cè)的高叢越桔UFGT基因序列進(jìn)行分析,具體在線生物信息學(xué)軟件如表1所示。

2 結(jié)果與分析

2.1 新基因的識(shí)別

以篤斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)為探針,獲得全長(zhǎng)為1 789 bp的Contig 1條,其開(kāi)放閱讀框長(zhǎng)度為1 161 bp,編碼386個(gè)氨基酸,具體見(jiàn)圖1。

2.2 高叢越桔UFGT基因編碼氨基酸一級(jí)結(jié)構(gòu)預(yù)測(cè)

蛋白質(zhì)是生命功能的執(zhí)行者,分析蛋白質(zhì)的氨基酸序列,是蛋白質(zhì)研究的重要組成部分。基于蛋白質(zhì)數(shù)據(jù)庫(kù),通過(guò)在線軟件ProtParam[10],對(duì)高叢越桔UFGT基因編碼的氨基酸的一級(jí)結(jié)構(gòu)預(yù)測(cè)見(jiàn)表2。

2.3 高叢越桔UFGT信號(hào)肽預(yù)測(cè)和分析

蛋白質(zhì)的跨膜轉(zhuǎn)運(yùn)主要依靠信號(hào)肽指導(dǎo)。采用SignaIP-4.1 Server[11],預(yù)測(cè)高叢越桔UFGT的信號(hào)肽,結(jié)果如圖2所示。可以看出,高叢越桔UFGT基因所編碼的蛋白質(zhì)不存在信號(hào)肽,該蛋白不進(jìn)行轉(zhuǎn)運(yùn)。

2.4 高叢越桔UFGT蛋白疏水性/親水性分析

對(duì)高叢越桔UFGT編碼的氨基酸用ProScale在線軟件[12]進(jìn)行親疏水性預(yù)測(cè),一般負(fù)值越大表示蛋白親水性越強(qiáng),正值越大疏水性越強(qiáng),結(jié)果如圖3所示。可以看出,高叢越桔UFGT編碼的蛋白為親水性蛋白質(zhì),最小值-1.476,最大值1.205,這與一級(jí)結(jié)構(gòu)預(yù)測(cè)的結(jié)果一致。

2.5 高叢越桔UFGT蛋白質(zhì)跨膜結(jié)構(gòu)預(yù)測(cè)

生物膜功能的主要承擔(dān)者為膜蛋白。通過(guò)在線跨膜蛋白結(jié)構(gòu)預(yù)測(cè)TMpred軟件預(yù)測(cè)其蛋白質(zhì)跨膜區(qū)和跨膜方向,結(jié)果如圖4所示。可以看出,該蛋白中存在3個(gè)跨膜區(qū),即32-51、86-104、249-270氨基酸位置。

2.6 高叢越桔UFGT蛋白的亞細(xì)胞定位

蛋白質(zhì)由位于細(xì)胞質(zhì)中的核糖體合成之后,需要轉(zhuǎn)運(yùn)到合適的位置才能正常行使其功能。基于蛋白質(zhì)數(shù)據(jù)庫(kù),使用Psort在線軟件[13]對(duì)高叢越桔UFGT蛋白進(jìn)行亞細(xì)胞定位,具體結(jié)果見(jiàn)圖5。可以看出,該蛋白在細(xì)胞質(zhì)和線粒體的概率是39.1%,在細(xì)胞核的概率是13.0%,在細(xì)胞液中有8.7%的概率,可能主要分布于細(xì)胞質(zhì)和線粒體中。

2.7 高叢越桔UFGT蛋白的二級(jí)結(jié)構(gòu)預(yù)測(cè)

蛋白質(zhì)中約85%的殘基處于3種穩(wěn)定二級(jí)結(jié)構(gòu),即α-螺旋、β-折疊和β-轉(zhuǎn)角。二級(jí)結(jié)構(gòu)預(yù)測(cè)的目的是根據(jù)一級(jí)結(jié)構(gòu)判斷殘基是否處于特定二級(jí)結(jié)構(gòu)。基于蛋白數(shù)據(jù)庫(kù),通過(guò)在線軟件SOPMA[14] 對(duì)高叢越桔UFGT蛋白進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè),具體結(jié)果見(jiàn)圖6。可以看出,該蛋白質(zhì)的二級(jí)結(jié)構(gòu)主要由4種形式組成,即由α-螺旋占41.97%,無(wú)規(guī)卷曲占30.57%,延伸鏈占17.88%,β-轉(zhuǎn)角占9.59%。據(jù)此推測(cè),α-螺旋是高叢越桔UFGT蛋白二級(jí)結(jié)構(gòu)中數(shù)量最多的結(jié)構(gòu)元件。

2.8 高叢越桔UFGT蛋白的三級(jí)結(jié)構(gòu)預(yù)測(cè)

采用同源建模法,利用SWISS-MODEL在線軟件[15]對(duì)高叢越桔UFGT蛋白的三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè),具體結(jié)果見(jiàn)圖7。可以看出,該蛋白主要有無(wú)規(guī)則卷曲、α-螺旋2種結(jié)構(gòu),同時(shí)還伴隨著延伸鏈、β-轉(zhuǎn)角2種結(jié)構(gòu),基本與二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果一致。

2.9 蛋白質(zhì)磷酸化位點(diǎn)分析

蛋白質(zhì)翻譯后有精氨酸甲基化、磷酸化、ADP核糖基化、糖基化等多種修飾形式,其中,磷酸化是一種重要的共價(jià)修飾方式。利用NetPhos 3.1 Server在線軟件分析[16]的具體結(jié)果見(jiàn)圖8。可以看出,有15個(gè)絲氨酸(Ser)、10個(gè)蘇氨酸(Thr)、1個(gè)酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點(diǎn)。

3 結(jié)論與討論

目前,越桔具有較高的營(yíng)養(yǎng)價(jià)值,且藥理作用正逐漸被人們認(rèn)識(shí)[17]。越桔含有豐富的多酚類物質(zhì),如黃酮醇、酚酸和花青素。其中黃酮醇具有降低心血管和退化性疾病的風(fēng)險(xiǎn)能力[18]。花青素被證明具有減輕炎癥、降低血糖、影響脂質(zhì)代謝和脂肪沉積、減少大分子的氧化損傷[19]等作用。

通過(guò)電子克隆技術(shù)預(yù)測(cè)高叢越桔UFGT基因,全長(zhǎng)為1 789 bp,開(kāi)放閱讀框長(zhǎng)度為1 161 bp,編碼386個(gè)氨基酸。該蛋白為親水性的非分泌蛋白,且其中存在一處跨膜區(qū)。該蛋白主要由α-螺旋、無(wú)規(guī)則卷曲構(gòu)成的二級(jí)結(jié)構(gòu),在細(xì)胞質(zhì)和線粒體中分布的可能性最大,有15個(gè)絲氨酸(Ser)、10個(gè)蘇氨酸(Thr)、1個(gè)酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點(diǎn)[20-21]。通過(guò)本研究預(yù)測(cè)的結(jié)果,為未來(lái)UFGT基因在高叢越桔中提取、克隆及基因功能方面的研究奠定基礎(chǔ),同時(shí)也為電子克隆技術(shù)的廣泛應(yīng)用提供參考。

4 參考文獻(xiàn)

[1] 趙建萍,柏新富,蔣小滿,等.北高叢越桔芽器官離體培養(yǎng)與快繁體系的建立[J].林業(yè)科學(xué),2007,43(5):111-115.

[2] 周軍,姚泉洪,彭日荷,等.巨峰葡萄查爾酮異構(gòu)酶基因克隆及表達(dá)分析[J].西北植物學(xué)報(bào),2009,29(9):1723-1729.

[3] KOBAYASHI S,ISHIMARU M,DING C K,et parison of UDP-glucose:flavonoid 3-O-glucosyltransferase (UFGT) gene sequences be-tween white grapes(Vitis vinifera) and their sports with red skin[J].Plant Science,2001,160(3):543-550.

[4] 付海輝,辛培堯,許玉蘭,等.幾種經(jīng)濟(jì)植物 UFGT 基因的生物信息學(xué)分析[J].基因組學(xué)與應(yīng)用生物學(xué),2010,30(1):92-102.

[5] 趙志常,胡福初,胡桂兵,等.荔枝類黃酮糖基轉(zhuǎn)移酶 (UFGT) 基因的克隆及其原核表達(dá)研究[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,29(4):104-110.

[6] HUMINIECKI L,BICKNELL R.In silico cloning of novel endothelial-specific genes[J].Genome Research,2000,10(11):1796-1806.

[7] GILL R W,SANSEAU P.Rapid in silico cloning of genes using expressed sequence tags (ESTs)[J].Biotechnology annual review,2000,5:25-44.

[8] 王冬冬,朱延明,李勇,等.子克隆技術(shù)及其在植物基因工程中的應(yīng)用[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2006,37(3):403-408.

[9] PHUANG X,MADAN A.CAP3:A DNA sequence assembly program[J].Genome research,1999,9(9):868-877.

[10] GASTEIGER E,HOOGLAND C,GATTIKER A,et al.Protein identifi-cation and analysis tools on the ExPASy server[M].Humana Press,2005.

[11] PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:disc-riminating signal peptides from transmembrane regions[J].Nature met-hods,2011,8(10):785-786.

[12] KYTE J,DOOLITTLE R F.A simple method for displaying the hydr-opathic character of a protein[J].Journal of molecular biology,1982,157(1):105-132.

[13] PSORT I I.PSORT:a program for detecting sorting signals in proteins and predicting their subcellular localization[J].J.Mol.Biol,1997,266:594-600.

[14] GEOURJON C,DELEAGE G.SOPMA:significant improvements in pr-otein secondary structure prediction by consensus prediction from mul-tiple alignments[J].Computer applications in the biosciences:CABIOS,1995,11(6):681-684.

[15] BIASINI M,BIENERT S,WATERHOUSE A,et al.SWISS-MODEL:m-odelling protein tertiary and quaternary structure using evolutionary in-formation[J].Nucleic acids research,2014:340.

[16] BLOM N,GAMMELTOFT S,BRUNAK S.Sequence and structure-ba-sed prediction of eukaryotic protein phosphorylation sites[J].Journal of molecular biology,1999,294(5):1351-1362.

[17] 李丹,林琳.越桔食品資源的開(kāi)發(fā)與利用[J].食品與發(fā)酵工業(yè),2000,26(4):76-81.

[18] 劉淑蘭,呂秀蓮,王曉軍,等.越橘的化學(xué)成分與藥理活性研究進(jìn)展[J].中醫(yī)藥學(xué)報(bào),2006,34(6):53-54.

[19] RISO P,KLIMIS-ZACAS D,DEL BO C,et al.Effect of a wild blueberry (Vaccinium angustifolium)drink intervention on markers of oxidative stress,inflammation and endothelial function in humans with cardiova-scular risk factors[J].European journal of nutrition,2013,52(3):949.

第11篇

人類基因組計(jì)劃的實(shí)施為分子生物學(xué)家提供了大量的生物組學(xué)數(shù)據(jù),分析和處理這些數(shù)據(jù)以探索其中隱藏的生物學(xué)奧秘需要綜合利用數(shù)學(xué)、信息科學(xué)與物理學(xué)等知識(shí),生物信息學(xué)由此應(yīng)運(yùn)而生[1]。它是分子生物學(xué)與上述學(xué)科交叉結(jié)合的產(chǎn)物,其研究已經(jīng)滲透到生命科學(xué)的各個(gè)領(lǐng)域并極大促進(jìn)了生命科學(xué)及相關(guān)學(xué)科的發(fā)展,已成為生命科學(xué)研究者強(qiáng)有力的輔助工具之一。國(guó)內(nèi)很多醫(yī)學(xué)院校已開(kāi)辦生物信息學(xué)課程,多種專業(yè)選擇其作為必修課或選修課。該課程旨在培養(yǎng)學(xué)生綜合運(yùn)用生物信息學(xué)知識(shí)和方法進(jìn)行生物信息提取、儲(chǔ)存、處理和分析的能力,但該課程的教學(xué)研究仍處于起步階段,缺乏完善的教學(xué)模式和有效的教學(xué)方法,如何在醫(yī)學(xué)院校開(kāi)展生物信息學(xué)教學(xué)還有待進(jìn)一步探索。

1 課程開(kāi)設(shè)的重要性

生物信息學(xué)跨越了整個(gè)生命科學(xué)領(lǐng)域,是一門實(shí)用性很強(qiáng)的學(xué)科,也是未來(lái)生物醫(yī)學(xué)的重要研究工具。生物技術(shù)、計(jì)算機(jī)和互聯(lián)網(wǎng)的飛速發(fā)展引領(lǐng)了一個(gè)生物醫(yī)學(xué)大數(shù)據(jù)時(shí)代,生物信息學(xué)在生命科學(xué)領(lǐng)域的地位也愈發(fā)重要。利用生物信息學(xué)的知識(shí)和方法能夠深入挖掘和剖析海量生物學(xué)數(shù)據(jù),進(jìn)而探索隱藏在數(shù)據(jù)背后的生物學(xué)奧秘。無(wú)論是從分子生物學(xué)的角度闡述疾病病因,還是對(duì)疾病的預(yù)防、診斷、防治與藥物設(shè)計(jì),生物信息學(xué)均發(fā)揮了十分重要的作用,掌握該課程的基本知識(shí)和理論無(wú)論對(duì)以后的科學(xué)研究還是從事一線醫(yī)務(wù)工作都具有比較深遠(yuǎn)的意義。因此,在醫(yī)學(xué)院校部分專業(yè)(如:生物統(tǒng)計(jì)、藥學(xué)等)開(kāi)設(shè)生物信息學(xué)課程具有重要意義。

2 生物信息學(xué)教學(xué)存在的問(wèn)題

2.1 課程內(nèi)容與教學(xué)課時(shí)不成比例

生物信息學(xué)是一門綜合性學(xué)科,理解和掌握該課程需要具有一定的計(jì)算機(jī)、數(shù)學(xué)和分子生物學(xué)等的背景知識(shí)。醫(yī)學(xué)院校學(xué)生普遍存在理科知識(shí)比較薄弱,因此,講解透徹該門課程需要教師在課堂上花費(fèi)一定的時(shí)間普及相關(guān)背景知識(shí)。然而由于醫(yī)學(xué)院校學(xué)生課程門類眾多,客觀條件決定無(wú)法為生物信息學(xué)安排足夠多的課時(shí)。較之生物信息學(xué)繁多的內(nèi)容而言,課時(shí)分配明顯不足。在課時(shí)相對(duì)較少的情況下,無(wú)法深入講解將每個(gè)章節(jié)的內(nèi)容。

2.2 教學(xué)師資力量薄弱

生物信息學(xué)作為一門交叉學(xué)科,要求任課教師精通生物學(xué)、計(jì)算機(jī)和統(tǒng)計(jì)學(xué)等相關(guān)知識(shí)。由于國(guó)內(nèi)生物信息學(xué)興起時(shí)間較短,培養(yǎng)人才數(shù)量有限,且有限的人才都流向了一流的學(xué)校,普通高校無(wú)法招到專業(yè)對(duì)口的教師。因此,能夠勝任生物信息學(xué)教學(xué)任務(wù)的老師十分匱乏。以該校為例,生物信息學(xué)課程沒(méi)有固定的任課教師,基本由生物學(xué)、醫(yī)學(xué)統(tǒng)計(jì)學(xué)教師完成,這些老師中大多數(shù)無(wú)法完全勝任生物信息學(xué)的教學(xué)任務(wù)。最終致使生物信息學(xué)教學(xué)質(zhì)量不高。

2.3 教學(xué)模式落后

雖然多媒體已被廣泛應(yīng)用于生物信息學(xué)的教學(xué)中,但由于該課程涉及內(nèi)容多且有大量的數(shù)據(jù)庫(kù)和軟件知識(shí),導(dǎo)致多媒體課件的容量非常大,教師在課堂上基本是照本宣科的讀完課件完成教學(xué)任務(wù)而已,忽略了學(xué)生的接受能力。這種教學(xué)模式雖然運(yùn)用了先進(jìn)的教學(xué)工具,但實(shí)質(zhì)上采用的還是傳統(tǒng)的“灌輸式”教學(xué),學(xué)生仍然是被動(dòng)地學(xué)習(xí)。

2.4 實(shí)踐教學(xué)流于形式

生物信息學(xué)是一門實(shí)踐性很強(qiáng)的學(xué)科,實(shí)踐課程非常重要。然而在教學(xué)過(guò)程中,由于各種原因?qū)嵺`課往往流于形式,原因主要包括:(1)教學(xué)設(shè)備及手段落后。雖然有些學(xué)校有計(jì)算機(jī)室,但計(jì)算機(jī)配置較低且未提供連網(wǎng)服務(wù),生物信息學(xué)很多知識(shí)的學(xué)習(xí)需要借助互聯(lián)網(wǎng),例如:各種數(shù)據(jù)庫(kù)、在線軟件等,導(dǎo)致學(xué)生無(wú)法親自操作而降低實(shí)踐課學(xué)習(xí)效果;(2)課時(shí)少、內(nèi)容多。生物信息學(xué)的章節(jié)往往涉及到很多軟件和平臺(tái),甚至有些軟件需要編寫程序。在實(shí)踐課時(shí)少的情況下,無(wú)法在短時(shí)間內(nèi)讓學(xué)校親自操作每一種軟件。

3 教學(xué)改革

3.1 針對(duì)不同專業(yè)精選教學(xué)內(nèi)容

針對(duì)生物信息學(xué)內(nèi)容繁多的事實(shí),應(yīng)針對(duì)不同專業(yè)特點(diǎn)精心挑選課授課內(nèi)容,在有限的課時(shí)中讓學(xué)生學(xué)到最基本且重要的生物信息學(xué)理論知識(shí)。另外,要善于挖掘課外時(shí)間,組建課外興趣小組,設(shè)置研究課題作為課外作業(yè),鞏固和加深學(xué)生對(duì)生物信息學(xué)的理解。

3.2 培養(yǎng)和引進(jìn)專業(yè)人才

教師知識(shí)的淵博程度和教學(xué)水平的高低對(duì)教學(xué)效果的影響十分明顯。因此,在教師隊(duì)伍建設(shè)上應(yīng)采取“走出去,引進(jìn)來(lái)”的措施,一方面挖掘該校教師的潛能,支持和鼓勵(lì)該校年輕教師到國(guó)內(nèi)外知名高校訪學(xué)和進(jìn)修,著力提高該校教師自身的知識(shí)素養(yǎng)與技能;另一方面提供豐厚條件引進(jìn)國(guó)內(nèi)外生物信息學(xué)高層人才,為生物信息學(xué)教學(xué)隊(duì)伍增添新鮮血液。此外,還可通過(guò)定期或不定期舉辦講座等方式創(chuàng)造機(jī)會(huì)加強(qiáng)該校教師及與兄弟院校的交流合作,加強(qiáng)學(xué)科建設(shè),提高生物信息學(xué)教師的綜合素養(yǎng)。

3.3 推進(jìn)“教、學(xué)、研”一體化創(chuàng)新教學(xué)模式

針對(duì)生物信息學(xué)課程的特點(diǎn),一方面根據(jù)課程內(nèi)容設(shè)計(jì)小型科研課題激發(fā)學(xué)生的科研興趣;另一方面鼓勵(lì)并指導(dǎo)學(xué)生申報(bào)學(xué)校、省級(jí)或國(guó)家級(jí)大學(xué)生科研項(xiàng)目,并鼓勵(lì)學(xué)生參與教師的科研項(xiàng)目,積極開(kāi)展“教、學(xué)、研”一體化的創(chuàng)新教學(xué)模式,即融教師的“教”和學(xué)生的“學(xué)”,以及教師和學(xué)生共同參與到“研”的過(guò)程于一體[2]。通過(guò)這種教學(xué)模式能夠極大激發(fā)學(xué)生對(duì)生物信息學(xué)課程的興趣和創(chuàng)造力,促使學(xué)生快速高效地掌握生物信息學(xué)理論和實(shí)踐知識(shí),有利于學(xué)生變被動(dòng)的學(xué)習(xí)為主動(dòng)探究式學(xué)習(xí)。與此同時(shí),也能夠讓學(xué)生盡早地融入到生物學(xué)科學(xué)研究的大環(huán)境中來(lái),學(xué)會(huì)合作、學(xué)會(huì)創(chuàng)造,真正地做到學(xué)以致用。

3.4 加強(qiáng)實(shí)驗(yàn)課教學(xué)

生物信息學(xué)實(shí)驗(yàn)課教學(xué)離不開(kāi)計(jì)算機(jī)和網(wǎng)絡(luò),加強(qiáng)實(shí)驗(yàn)課教學(xué)需要在現(xiàn)有設(shè)備的基礎(chǔ)上,升級(jí)計(jì)算機(jī)配置,并為每臺(tái)計(jì)算機(jī)提供上網(wǎng)功能,保障實(shí)驗(yàn)課教學(xué)順利進(jìn)行。積極鼓勵(lì)學(xué)生自帶計(jì)算機(jī),方便課后繼續(xù)學(xué)習(xí)。此外,充分利用發(fā)達(dá)的互聯(lián)網(wǎng)技術(shù),創(chuàng)建網(wǎng)上教學(xué)平臺(tái)并將教學(xué)內(nèi)容,最新分析軟件等傳遞給學(xué)生,通過(guò)教學(xué)平臺(tái)加強(qiáng)與學(xué)生的交流互動(dòng),及時(shí)解決學(xué)生學(xué)習(xí)過(guò)程中遇到的問(wèn)題。在教學(xué)內(nèi)容上,要精簡(jiǎn)實(shí)驗(yàn)課內(nèi)容,選擇有代表性的軟件和數(shù)據(jù)庫(kù)進(jìn)行深入講解,將其它的軟件、數(shù)據(jù)庫(kù)等相關(guān)知識(shí)設(shè)計(jì)成小型研究課題作為作業(yè)布置給學(xué)生,提高學(xué)生自主探索的學(xué)習(xí)能力。

第12篇

【關(guān)鍵詞】數(shù)學(xué)建模生物信息學(xué)教學(xué)

【中圖分類號(hào)】G64 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2014)05-0214-01

1. 引言

生物信息學(xué)是融合生命科學(xué)與數(shù)理科學(xué)的一門新興學(xué)科[1]。1995年在人類基因組計(jì)劃第一個(gè)五年總結(jié)報(bào)告中對(duì)生物信息學(xué)的定義是: “它是一門研究包括生物信息的獲取、處理、存儲(chǔ)、分發(fā)、分析和解釋等在內(nèi)的所有方面,并綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來(lái)闡明和理解大量數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義的新興的交叉學(xué)科。”隨著人類基因組計(jì)劃的完成,生物信息學(xué)的研究進(jìn)入了后基因組時(shí)代,它已廣泛的滲透到生物、醫(yī)藥、農(nóng)業(yè)、環(huán)境等各個(gè)相關(guān)研究領(lǐng)域中,成為生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一。目前,國(guó)內(nèi)很多高等院校已經(jīng)開(kāi)設(shè)了生物信息學(xué)本科專業(yè)。

數(shù)學(xué)建模是一門綜合多門學(xué)科知識(shí),集應(yīng)用與能力培養(yǎng)為一體,有利于培養(yǎng)學(xué)生的創(chuàng)造意識(shí)和應(yīng)用實(shí)踐能力的學(xué)科[2]。生物信息學(xué)專業(yè)的本科生在學(xué)習(xí)完基本的數(shù)理知識(shí)以及生物信息學(xué)專業(yè)基礎(chǔ)課后,通過(guò)數(shù)學(xué)建模課程的學(xué)習(xí),能夠使學(xué)生綜合運(yùn)用所學(xué)的知識(shí)解決實(shí)際問(wèn)題,實(shí)現(xiàn)了從理論學(xué)習(xí)到實(shí)踐應(yīng)用的跨越;使學(xué)生深刻體會(huì)到理論指導(dǎo)實(shí)踐,實(shí)踐進(jìn)一步檢驗(yàn)和完善理論的過(guò)程。本文對(duì)數(shù)學(xué)建模在醫(yī)學(xué)院校生物信息學(xué)專業(yè)的開(kāi)展及具體的教學(xué)進(jìn)行了實(shí)踐探索,目的是培養(yǎng)學(xué)生的建模思維和創(chuàng)新能力,為學(xué)生綜合運(yùn)用所學(xué)知識(shí)解決實(shí)際問(wèn)題以及今后的科研打下良好的基礎(chǔ)。

2. 教學(xué)實(shí)踐與探索

在醫(yī)學(xué)院校生物信息學(xué)專業(yè)的數(shù)學(xué)建模教學(xué)中,我們旨在通過(guò)體現(xiàn)學(xué)科特點(diǎn)的模型的學(xué)習(xí)以及實(shí)踐活動(dòng)培養(yǎng)學(xué)生的建模思維、實(shí)際動(dòng)手能力與創(chuàng)新能力。

2.1 精選模型,體現(xiàn)學(xué)科特點(diǎn)

在數(shù)學(xué)建模的教學(xué)中,我們主要通過(guò)學(xué)習(xí)已有的數(shù)學(xué)模型來(lái)完成整個(gè)課程的學(xué)習(xí),包括問(wèn)題的分析、模型的假設(shè)、模型的建立、模型的求解與分析以及后續(xù)的模型檢驗(yàn)與應(yīng)用等。因此如何選擇適當(dāng)?shù)哪P统蔀榻虒W(xué)中的首要問(wèn)題。

在選擇數(shù)學(xué)模型時(shí),除了注重模型需具有簡(jiǎn)潔性和趣味性[3]以外,我們特別選擇了能夠體現(xiàn)醫(yī)學(xué)院校生物信息學(xué)專業(yè)特點(diǎn)的模型,與學(xué)生所學(xué)的專業(yè)緊密結(jié)合。如DNA序列分類模型、人類癌癥基因預(yù)測(cè)模型、人類疾病網(wǎng)絡(luò)模型等。此外,在選擇這些模型時(shí)注意建立的模型具有階梯性,即由淺入深,由簡(jiǎn)到繁,以符合學(xué)生的邏輯思維。對(duì)于給定的實(shí)際問(wèn)題,我們首先想到的是最簡(jiǎn)單的模型,然后分析模型的局限性及產(chǎn)生的原因,進(jìn)而尋找策略改進(jìn)模型,如此形成一種階梯式的建模過(guò)程,最終使得建立的模型越來(lái)越接近實(shí)際問(wèn)題,達(dá)到完善的地步。例如,對(duì)于DNA序列分類模型(2000年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽試題),我們可以先后構(gòu)建特征密碼子概率分布判別模型、圖論最小生成樹(shù)模型以及向量空間直觀判別模型,這三個(gè)模型體現(xiàn)了模型逐步升級(jí)的過(guò)程。

2.2 逐步引導(dǎo),培養(yǎng)學(xué)生建模思維

數(shù)學(xué)建模需要綜合運(yùn)用多學(xué)科知識(shí),這對(duì)于剛剛接觸建模的學(xué)生來(lái)說(shuō)是比較困難的,需要逐步引導(dǎo)他們,培養(yǎng)建模思維。我們主要借助于具有階梯性的數(shù)學(xué)模型、多媒體教學(xué),通過(guò)講解和討論穿插的教學(xué)模式來(lái)引導(dǎo)學(xué)生。

仍以DNA序列分類模型為例,對(duì)于給定的已知類別的序列和待分類的人工序列(序列較短)及自然序列(序列較長(zhǎng)),首先想到的是從已知類別中提取特征,用特征對(duì)未知序列進(jìn)行分類。通過(guò)討論,大部分學(xué)生很自然的想到選取序列中ATGC四個(gè)堿基的含量作為特征,但是這個(gè)特征很粗,結(jié)果發(fā)現(xiàn)很多序列用這個(gè)特征無(wú)法分類。接下來(lái)學(xué)生想到用密碼子,對(duì)64個(gè)密碼子進(jìn)行分析提取特征,結(jié)果顯示此種特征對(duì)人工序列得到較好的分類效果,但不適用于自然序列。隨后基于上面的結(jié)果,進(jìn)一步應(yīng)用圖論中的最小生成樹(shù)模型解決問(wèn)題,發(fā)現(xiàn)分類效果較好。此外,在討論中,有學(xué)生也提到了應(yīng)用“與已知類別特征相近的物質(zhì)歸到一類”的思想,運(yùn)用二維向量夾角余弦進(jìn)行分類,結(jié)果表明分類效果優(yōu)于前兩種方法。在學(xué)習(xí)模型的過(guò)程中,我們邊講解邊引導(dǎo)學(xué)生思考問(wèn)題,討論問(wèn)題,并結(jié)合多媒體演示,環(huán)環(huán)相扣,這樣的學(xué)習(xí)方式往往引人入勝,充分調(diào)動(dòng)了學(xué)生學(xué)習(xí)的積極性,培養(yǎng)了學(xué)生的建模思維。

2.3 教研結(jié)合,培養(yǎng)學(xué)生動(dòng)手能力與創(chuàng)新能力

理論用于指導(dǎo)實(shí)踐,沒(méi)有實(shí)踐的理論是空洞的。在學(xué)習(xí)完別人建立的模型之后,我們要求學(xué)生自己動(dòng)手解決實(shí)際問(wèn)題,建立模型,正所謂的“依葫蘆畫瓢”。我們本著寓研于教,教研結(jié)合的思想,將科研中遇到的一些實(shí)際問(wèn)題融入教學(xué)中,充分發(fā)揮學(xué)生的想象力與創(chuàng)造力。我們精選具有生物信息學(xué)專業(yè)特點(diǎn)、體現(xiàn)學(xué)科前沿的兩個(gè)實(shí)際問(wèn)題作為建模試題,讓學(xué)生三人一組以論文形式完成。如我們選取了給藥方案(較簡(jiǎn)單)和人類癌癥miRNA預(yù)測(cè)(較復(fù)雜)兩個(gè)實(shí)際問(wèn)題作為建模試題。較簡(jiǎn)單的問(wèn)題讓學(xué)生利用實(shí)驗(yàn)課的時(shí)間進(jìn)行完成,較復(fù)雜的問(wèn)題以作業(yè)形式讓學(xué)生利用課余時(shí)間完成,并將兩次建模的成績(jī)作為學(xué)生本門課程的最后成績(jī)。

這種考核方式不僅培養(yǎng)了學(xué)生動(dòng)手能力與創(chuàng)新能力,而且讓他們體會(huì)到之前所學(xué)習(xí)的專業(yè)基礎(chǔ)課的意義所在。此外,學(xué)生們對(duì)科研問(wèn)題創(chuàng)造性的思維往往超乎我們的想象,為我們生物信息專業(yè)的發(fā)展注入新的力量,也為學(xué)生后續(xù)從事相關(guān)領(lǐng)域的研究工作打下堅(jiān)實(shí)的基礎(chǔ)。

3. 小結(jié)

筆者根據(jù)自己在醫(yī)學(xué)院校生物信息學(xué)專業(yè)數(shù)學(xué)建模課程的教學(xué)實(shí)踐,提出了幾點(diǎn)可行性的措施。本著寓研于教,教研結(jié)合的思想,通過(guò)精選體現(xiàn)學(xué)科特點(diǎn)的模型,采取講解和討論穿插的教學(xué)模式逐步培養(yǎng)學(xué)生的建模思維,利用建模試題培養(yǎng)學(xué)生實(shí)際動(dòng)手能力與創(chuàng)新能力,取得了較好的教學(xué)效果。隨著生物信息學(xué)以及相關(guān)學(xué)科的不斷發(fā)展,生物信息專業(yè)的數(shù)學(xué)建模課程將更加富有挑戰(zhàn)性,我們將根據(jù)科學(xué)發(fā)展以及學(xué)生的反饋意見(jiàn)不斷修訂教學(xué)內(nèi)容,豐富教學(xué)方法,提高生物信息學(xué)專業(yè)數(shù)學(xué)建模課程的教學(xué)質(zhì)量,真正培養(yǎng)學(xué)生分析問(wèn)題、解決問(wèn)題的能力。

參考文獻(xiàn):

[1]李霞,李亦學(xué),廖飛.生物信息學(xué)[M],北京:人民衛(wèi)生出版社,2010.

主站蜘蛛池模板: 安义县| 南漳县| 丰原市| 沙坪坝区| 扶余县| 武义县| 襄樊市| 阳谷县| 彩票| 彩票| 渭南市| 乐山市| 宜黄县| 昌黎县| 丰顺县| 台东市| 邵武市| 揭西县| 思南县| 潍坊市| 黄石市| 阜平县| 遂川县| 剑川县| 珲春市| 腾冲县| 永清县| 邳州市| 新郑市| 盐亭县| 梅州市| 连州市| 手游| 杂多县| 呼伦贝尔市| 田阳县| 司法| 宣武区| 张掖市| 清苑县| 潞西市|