中国(深圳)知识产权保护中心(深圳国家知识产权局专利代办处)

效能,服务,和谐
效能,服务,和谐
效能,服务,和谐
close

关于知识产权行业标准《电子文件标准》中部分特征关键词表的修订

来源:深圳市市场和质量监督管理委员会

发布时间:2017-07-24

字号:[ ]

  国家知识产权局公告

  第二四八号

  为了更好地满足社会公众对于生物序列专利申请、检索的信息化需要,国家知识产权局对知识产权行业标准《核苷酸和/或氨基酸序列表和序列表电子文件标准》(ZC 0003—2001,以下简称“《电子文件标准》”)中的“4.4.4、生物体:其数字标识符为<213>。”和“表5 与核苷酸序列相关的特征关键词表”的内容进行了修订。具体修订内容如下:

  一、《电子文件标准》第4部分“序列表和序列表电子文件中的数字标识符、内容及其格式”

  4.4.4、生物体:其数字标识符为<213>。

  在数字标识符<213>之后,应当用中文或拉丁文(当同时采用中文和拉丁文时,拉丁文应当放在中文之后并用圆括号括起来,例如,草履虫种(Paramecium sp.)注明该序列来源的生物名称,即科学命名的生物属种;或者是“人工序列”、“Artificial”、“未知”或“Unknown”。

  二、《电子文件标准》附录1“核苷酸和氨基酸符号和特征关键词表”

  表5 与核苷酸序列相关的特征关键词表

  关键词 

    

  allele 

  相关的个体或菌株含有相同基因的稳定的其它形式,该形式区别于这一位置的现有的序列(和或许其它序列) 

  attenuator 

  存在调节转录的终止的DNA区域,它控制了一些细菌操纵子的表达;位于启动子和第一个结构基因之间,引起转录的部分终止的序列区段 

  C_region 

  免疫球蛋白轻和重链的恒定区,和T-细胞受体αβ,和γ链;根据特定的链可包括一个或多个外显子 

  CAAT_signal 

  CAAT盒;位于可能参与RNA聚合酶结合的真核生物转录单位的起始点的75bp上游的保守序列的一部分;共有序列=GG(CT)CAATCT 

  CDS 

  编码序列;对应于蛋白质中的氨基酸序列的核苷酸的序列(位置包括终止密码子);特征包括氨基酸概念上的翻译 

  conflict 

  在这一位点或区域,单独确定的相同序列有所不同 

  D-loop 

  置换环;线粒体DNA内的一个区域,其中RNA的短的序列与DNA的一条链配对,代替了这一区域的原始配对DNA链;也用于说明在RecA蛋白质催化的反应中,侵入的单链替代双链DNA的一条链的区域 

  D-segment 

  免疫球蛋白重链的多变区,和T-细胞受体的β 

  enhancer 

  顺式-作用序列,它增强了(一些)真核生物启动子的作用,并能在任一方向和与启动子相关的任何位置处(上游或下游)起作用 

  exon 

  编码剪接mRNA部分的基因组区域;可以含有5'UTR,所有CDS,和3'UTR 

  GC_signal 

  GC盒;位于真核生物转录单位起始点上游的保守的富含GC区域,可以以多重拷贝 或任一方向存在;共有序列=GGGCGG 

  gene 

  鉴定为基因的生物学意义的区域,并已经指定名称 

  iDNA 

  间插DNA;通过几种重组中的任何一种能被消除的DNA 

  intron 

  被转录的DNA区段,但通过同时剪接位于其两侧的序列(外显子)即可从转录本内部将其除去 

  J_segment 

  免疫球蛋白轻链和重链的连接区段,和T-细胞受体αβγ 

  LTR 

  长的末端重复,在确定序列的两端直接重复的序列,类型典型地见于逆转录病毒中 

  mat_peptide 

  成熟的肽或蛋白质的编码序列;翻译后修饰之后成熟的或最终的肽或蛋白质产物的编码序列;位置不包括终止密码子(与相应的CDS不同) 

  misc_binding 

  不能用任何其它Binding关键词(primer_bindprotein_bind)表述的与另一个组成成分共价或非-共价结合的核酸中的位点 

  misc_difference 

  特征序列与记载中存在的有所不同,并且不能用任何其它不同关键词(conflictunsureold_sequencemutationvariationallelemodified_base)表述 

  misc_feature 

  不能用任何其它的特征关键词表述的具有生物学意义的区域;新的或少见的特征 

  misc_recomb 

  任何一般性的,位点特异性的或复制的重组事件的位点,该位点中有不能用其它重组关键词(iDNAvirion)或来源关键词的修饰词(/insertion_seq/transposon/proviral)表述的双螺旋DNA的断裂和愈合 

  misc_RNA 

  不能用其他RNA关键词(prim_transcript,precursor_RNA,mRNA,5'clip,3'clip,5'UTR,3'UTR,exon,CDS,sig_peptide,transit_peptide,mat_peptide,intron,polyA_site,rRNA,tRNA,scRNA和snRNA)限定的任何转录本或RNA产物

  misc_signal 

  含有控制或改变基因功能或表达之信号的任何区域,所述信号不能用其他Signal关键词(promoter,CAAT_signal,TATA_signal,-35_signal,-10_signal,GC_signal,RBS,polyA_signal,enhancer,attenuator,terminator,和rep_origin)表述

  misc_structure 

  不能用其他Structure关键词(stem_loopD-loop)表述的任何二级或三级结构或构象 

  modified_base 

  被指示的核苷酸是经修饰的核苷酸,并应由被指示的分子(mod_base修饰词意义中给出)所取代 

  mRNA 

  信使RNA;包括5'非翻译区(5'UTR),编码序列(CDS,外显子)3'非翻译区(3'UTR) 

  mutation 

  在此位置处,相关品系的序列中具有突发的,可遗传的变化 

  N_region 

  在重排的免疫球蛋白区段之间插入的额外的核苷酸 

  old_sequence 

  在此位置处,所表述的序列修改了此序列以前的版本 

  polyA_signal 

  聚腺苷酸化之后内切核酸酶裂解RNA转录本所必需的识别区域;共有序列=AATAAA 

  polyA_site 

  RNA转录本上的位点,通过转录后聚腺苷酸化该位点将被加上腺嘌呤残基 

  precursor_RNA 

  仍不是成熟的RNA产物的任何RNA种类;可包括5'剪切区(5'clip)5'非翻译区(5'UTR),编码序列(CDS,外显子),间插序列(内含子)3'非翻译区(3'UTR),和3'剪切区(3'clip) 

  prim_transcript 

  初级(最初的,未加工的)转录本;包括5'剪切区(5'clip)5'非翻译区(5'UTR),编码序列(CDS,外显子),间插序列(内含子)3'非翻译区(3'UTR)3'剪切区(3'clip) 

  primer_bind 

  起始复制,转录或逆转录的非-共价的引物结合位点;包括合成的例如PCR引物元件的位点 

  promoter 

  参与RNA聚合酶的结合以启动转录的DNA分子区域 

  protein_bind 

  核酸上非-共价的蛋白质结合位点 

  RBS 

  核糖体结合位点 

  repeat_region 

  含有重复单位的基因组区域 

  repeat_unit 

  单个重复元件 

  rep_origin 

  复制起点;复制核酸以得到两个相同拷贝的起始位点 

  rRNA 

  成熟的核糖体RNA;将氨基酸装配成蛋白质的核糖核蛋白颗粒(核糖体)中的RNA成份 

  S_region 

  免疫球蛋白重链的开关区;它参与重链DNA的重排,导致来自相同B-细胞的不同免疫球蛋白类的表达 

  satellite 

  短的基本重复单位的很多串联重复(相同或相关的);大多数具有的碱基组成或其它性质与基因组的一般水平不同,这使得它们与大部分(主带)的基因组DNA分离开来 

  scRNA 

  小的细胞质RNA;几个小的细胞质RNA分子中的任何一个存在于真核生物的细胞质和(有时)核中 

  sig_peptide 

  信号肽编码序列;被分泌的蛋白质的N-末端结构域的编码序列;此结构域涉及新生多肽与膜的结合;前导序列 

  snRNA 

  小的核RNA;很多小的RNA种类中的任何一个都被局限于核中;几个snRNA参与剪接或其它RNA加工反应 

  source 

  鉴定序列中特定范围的生物来源;此关键词是强制性的;每一项至少要有一个跨越整个序列的单一来源关键词;每个序列可允许有一个以上的来源关键词 

  stem_loop 

  发卡结构;由RNADNA单链的相邻(反向)互补序列之间的碱基一配对形成的双螺旋区域 

  STS 

  序列标记位点:表述基因组上作图界标并能通过PCR检测的短的,单拷贝DNA序列;通过测定STS系列的次序即可作出图谱的基因组区域 

  TATA_signal 

  TATA盒;Goldberg-Hogness盒;在每个真核生物RNA聚合酶转录单位起点前约25bp处发现的保守的富含AT的七聚体,它可能涉及使酶定位以正确地起始;共有序列=TATA(AT)A(AT) 

  terminator 

  或者位于转录本的末端或者与启动子区域相邻的DNA序列,该序列可导致RNA聚合酶终止转录;也可以是阻抑蛋白的结合位点 

  transit_peptide 

  转运肽编码序列;核编码的细胞器蛋白质N-末端结构域的编码序列;此结构域参与将蛋白质翻译后运送到细胞器中 

  tRNA 

  成熟的转移RNA,小的RNA分子(7585个碱基长),介导核酸序列翻译成氨基酸序列 

  unsure 

  作者不能确定此区域的准确序列 

  V_region 

  免疫球蛋白轻链和重链的可变区,和T-细胞受体αβγ链;编码可变的氨基末端部分;可由V_segmentD_segmentN_regionJ_segment组成 

  V_segment 

  免疫球蛋白轻链和重链的可变区段,和T-细胞受体αβγ链;编码大多数可变区(v_region)和前导肽的最后几个氨基酸 

  variation 

  含有来自相同基因的稳定突变的相关系列(例如RFLP,多态性等),在此(和可能其它)位置处所述相同基因与被表述的不同 

  3’clip 

  在加工过程中被切下的前体转录本3'端大部分区域 

  3’UTR 

  不被翻译成蛋白质的成熟转录本的3'末端区域(终止密码子之后) 

  5’clip 

  在加工过程中被切下的前体转录本5'端大部分区域 

  5’UTR 

  不被翻译成蛋白质的成熟转录本的5'末端区域(起始密码子之前) 

  -10_signal 

  Pribnow盒;细菌转录单位起点上游约10bp处的保守区域,它可能参与结合RNA聚合酶;共有序列=TatAaT 

  -35_signal 

  细菌转录单位起点上游约35bp处的保守六聚体;共有序列=TTGACa[]TGTTGACA[] 

  上述修订内容自2017年8月18日起正式实施;原标准中的被修订的内容同时废止。

  特此公告。

  国家知识产权局

  2017年7月24日