
目前,我們的日常生活中接觸到的工業(yè)化學物質(zhì)大約超過100,000種,其中一些可能對人體健康產(chǎn)生不利影響。
化學物質(zhì)的安全性通常通過動物試驗、細胞試驗、微生物試驗等生物檢測來評估。然而,在考慮時間、勞動力、物質(zhì)成本和動物倫理等多種因素時,以這種方式測試如此大量的化學物質(zhì)是不現(xiàn)實的。
▌定量構(gòu)效關系(QSAR)
為了實現(xiàn)可持續(xù)發(fā)展目標,需要一種能夠迅速準確識別有害化學物質(zhì)的有效篩選工具。定量構(gòu)效關系(Quantitative Structure Activity Relationships,QSAR)是一種計算機模擬方法,它主要基于各種分子描述符和模型算法,建立化合物的結(jié)構(gòu)與其理化性質(zhì),生物學活性,毒理學效應,環(huán)境行為和歸趨等的定性/定量關系,即根據(jù)目標物質(zhì)的化學結(jié)構(gòu)特征預測其生理效應或理化性質(zhì)等,具有快速高效的特點,能夠有效節(jié)約測試成本。
QSAR是目前國內(nèi)外一個活躍的研究領域,美國環(huán)境保護署(United States Environmental Protection Agency,簡稱US EPA)就基于QSAR開發(fā)了針對化學物質(zhì)毒性預測的軟件——Toxicity Estimation Software Tool (T.E.S.T)。
▌T.E.S.T
T.E.S.T軟件可根據(jù)大量的數(shù)據(jù)處理和統(tǒng)計識別目標化合物中潛在的有毒基團,還能快速地分析與目標物質(zhì)結(jié)構(gòu)相似的化合物的毒性,進一步綜合預測目標物質(zhì)的毒性。
T.E.S.T界面簡潔,操作簡單,并且軟件內(nèi)配有指南,易上手,用戶可通過CAS號、SMILES碼、物質(zhì)名稱、InChi碼、DTXSID或是手動繪制載入化學物質(zhì)結(jié)構(gòu),然后選定預測終點與方法,更改結(jié)果輸出路徑后即可進行預測,軟件預測完畢會自動生成結(jié)果報告。

T.E.S.T軟件用戶界面與基本操作流程
T.E.S.T的預測終點包括毒性和理化性質(zhì)兩大類別。
毒性預測終點:
預測終點 | 介紹 |
LC50(Fathead minnow 96-hr) | 96小時導致50%黑頭呆魚(Fathead minnow)死亡的水中試驗化學物質(zhì)濃度(mg/L)。 |
LC50(D. magna 48-hr) | 48小時導致50%大型蚤(Daphnia magna)死亡的水中試驗化學物質(zhì)濃度(mg/L)。 |
LC50(T. pyriformis 48-hr) | 48小時對50%梨形四膜蟲(Tetrahymena pyriformis)生長產(chǎn)生抑制作用的水中試驗化學物質(zhì)濃度(mg/L)。 |
LC50(Oral rat) | 導致50%的大鼠口服后死亡的化學物質(zhì)量 (mg/kg bw)。 |
生物富集因子 (Bioaccumulation factor) | 達到平衡狀態(tài)時,化合物在生物體內(nèi)濃度與環(huán)境介質(zhì)中濃度的比值。 |
發(fā)育毒性 (Developmental toxicity) | 化學物質(zhì)是否會對人類或動物產(chǎn)生發(fā)育毒性效應。 |
鼠傷寒沙門氏桿菌回復突變試驗 (Ames mutagenicity) | 如果化學物質(zhì)在鼠傷寒沙門菌菌株(Salmonella typhimurium)中誘導回復突變菌落生長,則該化合物為致突變物。 |
理化性質(zhì)預測終點:
預測終點 | 介紹 |
標準沸點 (Normal boiling poin) | 化學物質(zhì)在標準大氣壓(1個大氣壓)下沸騰的溫度(℃) |
蒸汽壓 (Vapor pressure) | 在25℃的密閉條件中,與固體或液體處于相平衡的蒸氣所具有的壓強(mmHg)。 |
熔點 (Melting point) | 化學物質(zhì)從固體變?yōu)橐后w的溫度(℃)。 |
閃點 (Flash point) | 化學物質(zhì)與外界空氣形成混合氣與火焰接觸時發(fā)生閃火并立刻燃燒的最低溫度 |
密度 (Density) | 單位體積質(zhì)量(g/cm3) |
表面張力 (Surface tension) | 液體表面層由于分子引力不均衡而產(chǎn)生的沿表面作用于任一界線上的張力(dyn/cm)。 |
熱導率 (Thermal conductivity) | 物質(zhì)傳導熱量能力的量度值 (mW/mK)。 |
黏度 (Viscosity) | 流體對流動所表現(xiàn)的阻力(cP) |
水溶性 (Water solubility) | 化學物質(zhì)溶于液態(tài)水中形成均相溶液的濃度(mg/L)。 |
預測方法:
T.E.S.T內(nèi)包含了Chi連接指數(shù)、Kappa形狀指數(shù)、2D結(jié)構(gòu)特征等14類,共計797個描述符。
同時,T.E.S.T的預測方法有5種,即層次聚類法、單一模型法、基團貢獻計算法、最近鄰法、一致性評價方法。用戶可依據(jù)自身需求選擇和合適的預測方法來增加預測結(jié)果的可信度。
方法 | 介紹 |
層次聚類法 (Hierarchical method) | 使用來自幾種不同聚類模型的預測加權平均值來預測化學物質(zhì)的毒性。 |
單一模型法 (Single model method) | 使用適合訓練集的多元線性回歸模型進行預測(使用分子描述符作為獨立變量)。 |
基團貢獻計算法 (Group contribution method) | 使用適合訓練集的多元線性回歸模型進行預測(使用分子片段計數(shù)作為獨立變量)。 |
最近鄰法 (Nearest neighbor method) | 通過取訓練集中與測試化學物質(zhì)最相似的3種化學物質(zhì)的平均值來預測目標化學物質(zhì)的毒性。 |
一致性評價方法 (Consensus method) | 通過取上述QSAR方法預測毒性的平均值來預測化學物質(zhì)的毒性(預測結(jié)果在各自方法的適用范圍內(nèi))。 |
模型擬合度:
用戶在進行QSAR預測時往往最關心的是預測結(jié)果的準確性。T.E.S.T.指南文件指出,如果QSAR模型滿足以下條件,則認為該模型具有可接受的預測能力:

R2是真實值與預測值之間的相關系數(shù)(即為不過原點回歸時相關系數(shù)的平方),R02是回歸曲線截距為零時真實值和預測值之間的相關系數(shù)(即為過原點回歸時相關系數(shù)的平方),k是回歸曲線截距為零時的回歸方程系數(shù)。公式(1)(2)都是對線性回歸模型的擬合度量,滿足(1)(2)公式條件,即說明模型擬合度較好,具有良好的預測能力。
指南文件介紹了軟件中各個QSAR模型的統(tǒng)計參數(shù),本文以LC50(fathead minnow 96-hr)毒性終點和標準沸點(Normal boiling point)的測試集結(jié)果為例介紹T.E.S.T中的模型性能。
LC50(fathead minnow 96-hr)測試集結(jié)果:


LC50(fathead minnow 96-hr)測試集結(jié)果顯示,五種方法的R2均滿足公式(1)的條件,且一致性評價方法的結(jié)果最好。單一模型法、基團貢獻計算法、一致性評價方法不滿足公式(2)的條件。
依據(jù)T. E. S. T.指南指出不滿足這些條件的模型本身并非絕對無效的,其預測結(jié)果是相對保守的,應該謹慎使用。
標準沸點(Normal boiling poin)測試集結(jié)果:


單一模型法不適用于標準沸點的預測,因此沒有其測試集結(jié)果,其余四種方法的三種指標均符合公式(1)(2)的條件。總的來說,標準沸點的測試集預測統(tǒng)計整體是很好的。
應用域介紹:
對于一個可靠的QSAR預測結(jié)果而言除了關注模型預測能力外,還需確定目標化合物是否在該模型的應用域范圍內(nèi)。應用域的功能就是界定能夠被QSAR模型可靠預測的化合物,也可理解為模型適用化合物的集合,通常可通過可從4方面來表征模型的應用域:
①描述符變化范圍;②結(jié)構(gòu)相似性;③機理相似性;④代謝轉(zhuǎn)化途徑和產(chǎn)物,
若目標化合物的上述特征在QSAR模型的應用域內(nèi),則預測結(jié)果具有良好的可靠性;反之,則預測結(jié)果不具備良好的可靠性。
以3-氯-2-甲基苯胺(CAS:87-60-5)的IGC50(T. pyriformis 48-hr)預測為例,如下圖所示,3-氯-2-甲基苯胺均在層次聚類法建立的多個預測模型的應用域范圍內(nèi),即Applicability Domain的一列結(jié)果均為“OK”,因此模型的總體預測結(jié)果相對可靠。
若目標化合物預測結(jié)果此列并非“OK”,而顯示為“Rmax constraint not met”、“Model ellipsoid constraint not met”或是某個結(jié)構(gòu)片段超出應用域范圍,其預測結(jié)果須謹慎使用。

綜上所述,T.E.S.T是一款由US EPA官方研究開發(fā)的QSAR毒性預測軟件,可以根據(jù)化合物的結(jié)構(gòu)信息預測其潛在毒性及理化性質(zhì),其中包括較為常見的7種毒性預測終點和9種理化性質(zhì)預測終點,并且具有5種預測方法,預測能力較好,結(jié)果可信度較高,但在使用的過程中仍需要對目標物質(zhì)和預測結(jié)果進行專家評估以得出專業(yè)準確的結(jié)論。
在使用方面,軟件整體安裝簡單,操作便捷,用戶界面友好,并且配有較為詳細的用戶指南。隨著US EPA地不斷更新與完善,目前TSET已經(jīng)更新至5.1.2版本,適用于Windows和macOS系統(tǒng)。更詳細的內(nèi)容請參考軟件指南User’s Guide for T. E. S. T. (Toxicity Estimation Software Tool) Version 5.1。
軟件鏈接:Toxicity Estimation Software Tool (T.E.S.T) | US EPA

參考文獻:
[1] Honma M. An assessment of mutagenicity of chemical substances by (quantitative) structure-activity relationship. Genes Environ. 2020;42:23.
[2] De P, Kar S, Ambure P, et al. Prediction reliability of QSAR models: an overview of various validation tools. Arch Toxicol. 2022;96(5):1279-1295.
[3] U.S. EPA (2020). User’s Guide for T.E.S.T (version 5.1) (Toxicity Estimation Software Tool): A Program to Estimate Toxicity from Molecular Structure.
[4] 唐睿,張松林,粱云明,等. 毒性評估軟件T.E.S.T及其在農(nóng)業(yè)污染化合物QSAR研究中的應用[J]. 安徽農(nóng)業(yè)科學,2010,38(36):20878-20879,20882
[5] US EPA. Environmental Optimization Using the Waste Reduction Algorithm. 2011 4/18/16]; Available from: nepis.epa.gov/Exe/ZyPURL.cgi?Dockey=P100DZKT.TXT.
[6] Martin TM, Harten P, Young DM, et al. Does rational selection of training and test sets improve the outcome of QSAR modeling?. J Chem Inf Model. 2012;52(10):2570-2578.
[7] 王中鈺,陳景文,傅志強,等.QSAR模型應用域的表征方法[J].科學通報,2022,67(3):255-266.
[8] 陳景文,李雪花,于海瀛,王亞南,喬顯亮.面向毒害有機物生態(tài)風險評價的(Q)SAR技術:進展與展望[J].中國科學(6期):461-474[2024-01-16]
※ 以勒申明:
本文內(nèi)容來源:由以勒標準翻譯整理。以勒標準尊重知識產(chǎn)權,如轉(zhuǎn)載內(nèi)容涉及版權問題,煩請聯(lián)系我們及時處理。翻譯/整理不易,凡轉(zhuǎn)載或引用本網(wǎng)站內(nèi)容,請注明來源:杭州以勒標準,感謝您的支持!更多法規(guī)資訊實時跟蹤,可搜索“以勒標準”官方微信公眾號,獲取第一手法規(guī)資訊,掌握最佳貿(mào)易時機!
< 上一個:專家文章|走進計算毒理學:QSAR從原理到應用
> 下一個:ICH M7(R2)指導原則的介紹與解讀
0571-8519 0521
157875742
infor@jirehstandard.com