溶出曲线的常见评价⽅法及优劣性探讨
溶出曲线的常见评价⽅法及优劣性探讨
来源
《中国新药杂志》2021 年第30 卷第22 期
作者
马莉,祝传勇,何⼩琳,段湘宁,⾼志晨,吕昭云,谭德讲
中国⾷品药品检定研究院
北京协和药⼚
摘要
⽬的: 对溶出曲线常见评价⽅法的性能进⾏⽐较分析,并探讨当溶出数据呈较⾼变异时,⽆法使⽤f 2 因⼦的情况下,哪种替代⽅法较为合适。
⽅法:以双环醇⽚作为实例,收集20 批溶出数据,使⽤不同评价⽅式进⾏⽐较,包括⾮模型依赖⽅式、模型依赖差异性⽐较⽅式和等效性⽐较⽅式( 建⽴模型参数等效区间) 。
结果:在溶出数据变异较⼤( >10%) 时,⾮模型依赖法中的f 2 -bootstrap 法的结果与多变量统计距相⽐,更接近f 2 因⼦法的结果; 模型依赖法⽐较中的t 检验法和多变量统计矩法的结果,与f2 因⼦法有较⼤差异; ⾸次利⽤模型参数获得的各参数容忍区间; 可作为模型参数的等效区间供今后溶出⼀致性的评估。
结论:当选择⾮模型依赖法时,当原f 2 因⼦法不适⽤时,f 2 -bootstrap 法可作为f 2 因⼦法的替代⽅法; 新提出模型参数的等效区间能够弥补t 检验的不⾜,更好地从质量等效层⾯上评价溶出曲线。
关键词
溶出曲线; f 2 因⼦; f 2 -bootstrap; 多变量统计矩; 模型依赖法; 等效区间
_正⽂_
随着药品⼀致性评价⼯作的开展,体外溶出曲线的评价越来越受到监管部门和药品研发⼈员的重视。相⽐于单点取样测定溶出度的⽅式,在药品研发阶段,完整地研究和评价溶出曲线可以全⾯了解制剂的内在质量,可为今后药品质量的⼀致性评价提供更多科学依据[1]。并且,对于⼀些具有较好体内
外相关性的药物,溶出曲线的⽐较可以替代体内⽣物等效性试验,将⼤⼤降低仿制产品的研发成本。
药品的溶出⾏为不仅与检测⽅法有关,还与⾃⾝的理化性质和处⽅⼯艺密切相关。在评价其溶出曲线特征时,所⽤统计分析⽅法也要⽐简单的线性分析相对复杂。⽤于⽐较溶出曲线相似性的⽅法有多种,包括⾮模型依赖法和模型依赖法。其中⾮模型依赖的f 2 相似因⼦法是最常⽤且被⼴泛推荐的计算⽅法。然⽽,f 2 因⼦法在使⽤时具有诸多限制条件,例如其计算公式中代⼊的是平均溶出量,只适宜在各取样点数据变异性不⾼时使⽤( 第1 个取样点的变异系数不超过20%,之后的所有取样点变异系数不超过10%) 。在溶出数据发⽣较⾼变异的情况下,美国FDA 提出了多种替代f 2 因⼦法的⽅法,包括⾮模型依赖的多变量统计矩法( multivariate statistic distance,MSD) 、f 2 -bootstrap 法等[2]。此外,也有部分⽂献[3]提出使⽤模型依赖法预测药品溶出⾏为的⽅式,提供关于药品溶出更多的信息。但对溶出曲线进⾏模型拟合后,如何判断模型参数的相似性尚未形成统⼀意见。
本⽂以国内原创药品普通速释制剂双环醇⽚的溶出数据为实例,通过⽐较不同的溶出曲线评价⽅法,探讨最佳评价⽅式。以典型批为参⽐,采⽤⽬前常见的⾮模型依赖法( 如f 2 /f 1 因⼦法、MSD 法和f 2 -bootstrap 法) 以及模型依赖法( 如模型参数的t 检验法和MSD 法) 对曲线相似性进⾏⽐较研究,并创新性地提出建⽴模型参数的等效区间,探索适⽤于该品种溶出⾏为⼀致性评价的更优模式。
材料与⽅法
1 数据来源
收集协和药⼚⽣产的普通速释制剂双环醇⽚20 批溶出测定数据进⾏分析。该数据集来源于2组实验⼈员使⽤2 台溶出仪所获得的实验数据( 溶出仪已校正,溶出曲线测定⽅法已验证) 。溶出度的测定按照《中华⼈民共和国药典》2015 年版四部通则0931 第⼆法“桨法”中“溶出度与释放度测定法”[4]进⾏操作,转速为50 r·min - 1 ,溶出介质为pH2.0 的HCl 溶液,在该溶出介质下,产品呈现较⾼变异性,即第2 个取样点的变异系数可能>10%。本实验设6 个取样点,分别在5,10,15,20,30 和45 min 取样,《中华⼈民共和国药典》2015 年版四部通则0401“紫外-可见分光光度
法”[5],在278 nm 处测定吸光度,计算溶出量。
2 数据处理⼯具
f 1 /f 2 因⼦法及其他⾮模型依赖法的数据处理采⽤⽂献中报道的excel 插件DDSolver[6],由于多变量统计矩法需要使⽤多批参⽐制剂以确定相似性限度,因此选取3 批制剂作为“参⽐制剂”进⾏计算;模型依赖法的数据处理采⽤JMP 软件计算。
3 数据分析⽅法介绍
3.1 ⾮模型依赖法介绍
3.1.1 f 2 相似因⼦法
美国FDA 在1999 年发布的《⼝服固体⽣物利⽤度和⽣物等效性研究指南》中⾸次推荐使⽤f2 相似因⼦法来评估溶出曲线的相似性,经过多年的推⼴应⽤,现已成为各国及国际组织⾸要推荐的⽅法[2,7-8]。f 2 相似因⼦的计算公式如下:
公式中,R t和T t分别为参⽐制剂和受试制剂在时间t 时的平均累计百分溶出量,n 为取样时间点的个数。
由公式( 1) 可知,当2 条曲线各点平均溶出量差值为10%时,f 2 = 50,将此作为溶出曲线相似的临界值,即f 2 ≥50 时,认为2 条溶出曲线相似[1]。
f 2 因⼦法计算简便,通过f 2 值直观地对溶出曲线进⾏⽐较,但也存在很多局限之处: ①没有考虑参⽐和受试制剂数据变异的影响,这也导致了各指导原则中均对溶出数据的变异系数作出了规定: 第1 个取样点的变异系数不超过20%,之后的所有取样点变异系数不超过10%[2,7-8]。②取样时间点的选择对相似性计算结果影响很⼤[9]。如果溶出量>85%的时间点过多,则会⼈为增⼤结果相似的概率,因此有些指导原则中也对取样时间点的选择作出了详细规定[9]。③⽬前以各点平均溶出量10%的差值作为曲线相似的界限值,然⽽建⽴此判断标准的科学依据是不清晰的[2],未有证据说明10%的差值是否真正代表了溶出曲线的差异。
3.1.2 f 1 差异因⼦法
不同于f 2 因⼦⽤于⽐较2条曲线的相似程度,f 1 因⼦⽤于⽐较曲线间的差异程度,当f 1 ≤15 时,认为2 条溶出曲线相似[3]。计算公式如下:
从公式( 2) 可以看出,f 2 和f 1 因⼦法都是基于参⽐和受试制剂各取样点的溶出量均值进⾏计算,因⽽也存在相同的局限之处。此外,当参⽐和受试对象互换时,f 2 值不变,f 1 值发⽣改变,但相似性结果本不应受到影响[3],这也导致了在实践中f 2 因⼦⽐f 1 因⼦的应⽤更为普遍。
在溶出数据发⽣⾼变异的情况下,已经有⽂献提出了替代f 2 因⼦的其他⽅法。FDA 先后提出了⾮模型依赖的MSD 法和f 2-bootstrap 法来⽐较溶出曲线。
3.1.3 ⾮模型依赖的MSD 法
国家药品监督管理局[7]和FDA[2]都提出了使⽤⾮模型依赖的MSD 法描述溶出曲线数据的相似性,MSD 值的计算过程⽐较复杂,现在被⼴泛采纳的是Tsong 等[10]使⽤的马⽒距离( Mahalanobis distance) 法。其计算原理是代⼊多批参⽐制剂的溶出量,两两⽐较进⾏计算得到多个MSD 值,并以最⼤值作为相似性限度,然后计算受试制剂与参⽐制
批参⽐制剂的溶出量,两两⽐较进⾏计算得到多个MSD 值,并以最⼤值作为相似性限度,然后计算受
试制剂与参⽐制剂的MSD 值的90%置信区间[6,10]。当区间上限低于预定义的相似性限度时,即可认为2 条溶出曲线相似。但由该⽅法计算原理可以看出,其相似性限度仅通过⼏批参⽐制剂确定较为粗糙,不能反映药品溶出的⼀致性范围。
3.1.4 f 2 -bootstrap 法
bootstrap 统计⽅法是指采⽤放回抽样的⽅式从原始样本中进⾏重复抽样,以估算所需统计量,最终得到统计量( 即f 2 )的置信区间,并以f 2 的置信下限作为溶出相似的判断依据。为了得到稳定的结果,⼀般使⽤软件对溶出数据进⾏⾄少5 000 次模拟抽样,得到f 2 值的90%置信区间[11]。当此区间下限≥50 时,即可认为2 条溶出曲线相似。f 2 -bootstrap 法是f2 法的衍⽣,仍未脱离以溶出量差值<10%作为相似性的判断标准。以上所述是对⼏种⾮模型依赖⽅式的⽐较,这⼏种⽅式均未涉及时间和溶出量的相关性,且⽆法提供单组数据溶出⾏为的任何信息。
3.2 模型依赖法介绍
有研究者提出了模型依赖法,⽤数学模型来拟合溶出时间和溶出量之间的关系,以全⾯描述产品的溶出⾏为[12-13]。常⽤的模型包括零级释放、⼀级释放、logistic ⽅程和Weibull ⽅程等[14]。在确定最佳拟合模型后,通过⽐较模型参数的⼀致性来判断溶出曲线的相似性。
3.2.1 模型参数的t 检验法
t 检验法是通过对参⽐批和受试批的各模型参数进⾏双样本t 检验,根据P 值结果评估溶出曲线的相似性。本⽂中计算时将临界P 值设为0.01,当P 值>0.01 时,认为2 组数据⽆显著性差异,溶出曲线相似。但是t 检验是差异性检验,只有当P 值<0.01,拒绝原假设时,得出的结论才是有意义的。在此情况下,P 值>0.01 只代表现有数据⽆法证明两者不相似,这并不等同于两者相似。
3.2.2 模型依赖的MSD 法
相关指导原则中还推荐使⽤模型依赖的MSD 法来⽐较溶出曲线[2,7],其计算原理与前述的MSD 法基本⼀致,但是公式中的计算对象不再是各取样点的溶出量,⽽是通过拟合⽅程得到的模型参数。同样地,此法仅通过⼏批参⽐制剂确定相似性限度,⽆法代表产品的真正⼀致性范围。
内容由凡默⾕⼩编查阅⽂献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明来源于凡默⾕。
结果
1 ⾮模型依赖法的计算结果分析
以相似性结论作为阳性结果,不相似性结论作为阴性结果,对各种⽅法进⾏⽐较,主要的评价指标如下。
灵敏度( sensitivity,SE) [16]: 是替代⽅法的真阳性率,指⽅法能够对实际相似曲线作出相似性结论的能⼒,其计算公式为S /S f2 ,其中S 是使⽤该⽅法和f 2 法同时判断曲线相似的数量,S f2 则是使⽤f 2 法判断曲线相似的数量。
特异度( specificity,SP) [16]: 是替代⽅法的真阴性率,指⽅法能够对实际不相似曲线作出不相似结论的能⼒,其计算公式为NS /NS f2 ,其中NS 是使⽤该⽅法和f2 法同时判断曲线不相似的数量,NSf 2 则是使⽤f 2 法判断曲线不相似的数量。
相应的,假阳性率( false positive rate,FPR) 即不相似曲线被判断为相似的概率,其计算结果与特异度相关( 1-SP ) ; 假阴性率( false negative rate,FNR) 即相似曲线被判断为不相似的概率,其计算结果与灵敏度相关( 1-SE) [16]。
按照上述计算公式,将3 种替代⽅法的评价结果汇总见表4。
根据上表可以看出: f 1 法的灵敏度和特异度都为1,和f 2 法最为⼀致,但这2 种⽅法都未考虑到溶出数据的变异情况。
根据上表可以看出: f 1 法的灵敏度和特异度都为1,和f 2 法最为⼀致,但这2 种⽅法都未考虑到溶出数据的变异情况。当溶出数据存在较⼤变异时,常见的⾮模型替代⽅法有f 2 -bootstrap 法和MSD 法。
根据表1,f 2 -bootstrap 法的灵敏度为0.88,较f 2 法偏低,这可能是由于存在较⼤的数据变异,计算出f 2 值的置信区间较宽,得到的置信下限更低[11],但这也反映其⽐传统的f 2 法更符合实际情况。⾮模型依赖的MSD 法的灵敏度为0. 76,假阴性率为0. 24,容易将使⽤f 2 因⼦法判定相似的曲线判定为不相似,这会增加⽣产商风险。
总体来说,f 2 -bootstrap 法较好地兼顾了灵敏度和特异度,当溶出曲线变异较⼤时是较好的替代⽅式。从监管⾓度来看,f 2 -bootstrap 法减少了假阳性结果,有利于提⾼产品质量⼀致性; 并且相⽐于f 2 法使⽤点估计的⽅式,f 2 -bootstrap 法构建了置信区间,是⼀种更为科学合理的计算⽅法。这也印证了在其他⽂献[11]⾥推荐使⽤f 2 -bootstrap 法的结论。
2 模型依赖法的计算结果分析
以前⾯收集的20 批双环醇⽚溶出数据为实例,确定其最佳拟合模型。指导原则中推荐使⽤三参数模型进⾏拟合,参数太多不但计算繁琐,对于普通速释制剂⽽⾔也不能提供更多有价值的信息。⽤于拟合溶出曲线的模型众多[12,15],基于双环醇⽚的溶出曲线形状选择了3 个可能的模型,即logistic 三参数模型、Gompertz 三参数模型和Weibull 三参数模型。⽤于模型⽅程的拟合优度评价指标主要包括:
AICc 值( corrected akaike information criterion ) 和RMSE 值( root mean square error) ; AICc 值和RMSE值越⼩,表明模型的拟合优度越好[9]。使⽤以上3个模型对20 批数据分别进⾏拟合,20 批数
据的拟合结果均⼀致: 对于AICc 评价指标,Weibull 模型<Gompertz 模型< logistic 模型; 对RMSE 评价指标,Weibull 模型<Gompertz 模型<logistic 模型,由此判断,Weibull 三参数模型为最佳拟合模型。Weibull三参数⽅程可以表达为:
其中,F 和t 分别表⽰累计百分溶出量和溶出时间; a 表⽰上渐近线,即累计最⼤百分溶出量; b 表⽰拐点,为溶出量为最⼤溶出量⼀半的点; c 则是在b 点周围的增长率参数。
使⽤模型⽅程拟合溶出曲线后,同样以公认的f2 因⼦法作为参照标准,⽐较模型依赖法的结果,见表5~表8。
t 检验法的假阴性率为0.8,发⽣假阴性结果的概率很⼤,这可能是由于样本数据的⾼变异性,以及样本量过少,同时得到3 个参数的检验P 值均>0. 01 的结论⽐较困难,易将本来相似的溶出曲线判定为不相似。模型参数的MSD 法灵敏度为0.63,⾼于t 检验法,但仍不及⾮模型依赖法。因此,这2 种常见的模型依赖法的结果与f 2 因⼦法均存在较⼤差异,不适宜作为f 2因⼦法的替代⽅法。
3 模型参数⽐较的改进⽅式
由前⾯的⽐较结果看出,模型依赖法虽然能够全⾯了解药品的溶出⾏为,但模型参数的⽐较结果与其他⽅法差距很⼤,本⽂同样思考了如何改进模型参数的⽐较⽅式。由于在⼀致性检验中,等效性检验
bootstrap检验方法要优于t 检验。等效性检验的⼀种经典⽅法是检验所求得指标或参数的置信区间是否在预先定义的等效区间内[17]。有关等效区间的制定,冯国双等[18]总结了药品检验中等效区间的多种确定⽅法。本⽂对多批参⽐制剂的溶出数据进⾏Weibull 模型拟合,得到多组模型参数( 见表9) ,然后计算Weibull 模型中3 个参数的容忍区间作为模型参数的等效区间。
针对3 组参数a,b,c,在确定各组参数的数据分布均呈正态分布、⽆异常数据点的情况下,确定各⾃的容忍区间,结果见表10。
表中给出了在95%的置信⽔平下,包含不同⽐例总体的容忍区间。考虑到本实验中样本量还不够⼤( n = 20) ,选择95%/90%的容忍区间可能是合适的。随着后期样本数据的积累,可选择95%/99%的容忍区间,对产品的等效区间不断调整。在固定了模型参数的等效区间后,当产品发⽣变更,需要进⾏溶出曲线⽐较时,⽆需再选择参⽐制剂,只需求得变更后溶出模型参数的置信区间。当该置信区间落在此等效区间的范围内,可判定等效,即溶出曲线相似。
讨论
溶出度试验可揭⽰药物的质量⼀致性[19-20],在某些具有体内外相关性的药物中还作为体内研究的替代⽅法,因⽽成为药物制剂开发过程中的关键环节。基于平均溶出量计算的f 2 因⼦法,虽然在各国的指导原则中被⼴泛推荐使⽤,但其具有诸多限制条件。在⼀般的药典规定溶出条件下,药物溶出
曲线通常表现出低变异性,然⽽在其他3 种溶出介质下,有可能会表现出较⾼变异性,此时f 2 因⼦法不再很好地适⽤[11]。此外,如何选择参⽐批是个尚未解决的问
下,有可能会表现出较⾼变异性,此时f 2 因⼦法不再很好地适⽤[11]。此外,如何选择参⽐批是个尚未解决的问题,当参⽐批不同时,相似性结论可能发⽣差异。更重要的是,以10%溶出量差值作为相似性标准的原理是模糊的,f 2因⼦法缺乏统计学上的严谨性[21]。
本⽂以具有溶出变异性较⾼的产品作为实例,根据多批实验数据进⾏分析,加深了对各种溶出曲线评价⽅法的理解和应⽤,填补了国内指南中关于如何⽐较⾼变异性产品溶出曲线的空缺,为其提供了有价值的信息。由实验结果看出,⾮模型依赖的f 2 -bootstrap 法和MSD 法都可作为评价⾼变异溶出曲线的替代⽅法。在本实例中,f 2 -bootstrap 法的结果与f 2 法更为⼀致,但对于其他产品,替代⽅法的适⽤性可能发⽣变化。此外,这2 种⽅法仍存在缺点: f 2 -bootstrap 法在溶出数据变异性太⾼时往往得到更宽的置信区间,增⼤了得到不相似结论的风险; ⽽模型依赖的MSD 法仅以3 批参⽐制剂计算出相似性限度,可能过于狭窄,导致假阴性风险增⼤。模型依赖法通过模型拟合对溶出曲线进⾏了全⾯描述,拟合出的各模型参数可以提供有关溶出曲线的更多信息,如拐点、溶出速率、渐近线等,可更全⾯科学地描述出产品的溶出⾏为。但模型法计算复杂,需要专门的统计⼯具,相信随着计算机软件的推⼴,今后会更多地使⽤该⽅法。
对于如何⽐较模型参数,就本实例的数据分析来看,以往的t 检验法和模型参数的MSD 法都与f 2法的结果存在较⼤差异。本⽂提出的模型依赖法的改进⽅式,即基于多批参⽐制剂确定等效区间的⽅式,确定了产品溶出曲线模型参数的容忍区间,摆脱了点⽐较的局限性,真正从质量属性等效层⾯上对药物溶出曲线进⾏⽐较,具有更好的现实意义。
⽆论是使⽤⾮模型依赖法还是模型依赖法,在前期实验设计时,都必须要考虑到取样时间点问题。当使⽤f 2 因⼦法计算溶出曲线相似性时,⼀般取样点不能少于3 个; ⽽当采⽤模型⽅程拟合溶出曲线时,其取样点数的设计要考虑到参数的个数。溶出模型为三参数时,则⾄少应有5 个取样点,如此⽅能保证所拟合参数的准确可靠性,本⽂在实验设计阶段选择了6 个取样点符合需求。另外,计算f 2 因⼦时,关键时间点的选取必不可少,对于模型依赖法同样如此,所测时间点应该能描述溶出曲线变化情况,尤其是能反映关键时刻的变异情况,例如拐点和渐近线的位置等。
参考⽂献
详见《中国新药杂志》22021 年第30 卷第22 期
免责声明
内容由凡默⾕⼩编查阅⽂献选取,排版与编辑为原创。如转载,请尊重劳动成果,注明来源于凡默⾕。
⽂章内容为作者观点,不代表本⽴场。
⽂章搜索
本开通往期⽂章任意搜功能啦
在菜单栏中输⼊“搜索”,即可搜索往期内容