Нуклеотидна послідовність

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
Електроферограма, отримана автоматичним секвенсером, показує фрагмент нуклеотидної послідовності.

Нуклеотидна або генетична послідовність — послідовність букв, що представляють первинну структуру реального або гіпотетичного ланцюжка нуклеїнової кислоти (зазвичай ДНК), що може нести генетичну інформацію.

Можливими буквами є A, C, G і T, які являють собою чотири нуклеотиди, що входять до складу ДНК — аденін, цитозин, гуанін і тимін і ковалентно зв'язані із фосфатно-цукровим остовом молекули. Нуклеотидна послідовність йде без пробілів, хоча пробіли можуть додаватися для зручності сприйняття людиною. Послідовність, написана зліва направо, наприклад AAAGTCTGAC, означає послідовність, що йде в напрямку від 5' до 3' .

Біологічна функція послідовності залежить від закодованої в ній інформації. Послідовність може бути «змістовна» або «сенс» (що несе інформацію, яка зчитується в живій клітині) та «антизмістовна» чи «антисенс» (комплементарна їй послідовність, наприклад антисенсова РНК). Крім того, послідовність може бути кодуючою (що переводиться у амінокислотну послідовність білків у процесі біосинтезу білків за правилами генетичного коду) або некодуючою (некодуючі РНК).

Нуклеотидна послідовності ДНК біологічного зразку може бути отримана у процесі секвенування ДНК. У деяких випадках, особливо при порівнянні послідовностей, окрім букв A, T, C і G в послідовності використовуються інші. Ці букви представляють багатозначність, тобто в цьому положенні може бути присутнім більш ніж один тип нуклеотидів. За правилами Міжнародного союзу теоретичної і прикладної хімії (IUPAC) використовуються такі букви:

       A = аденін
       C = цитозин           
       G = гуанін             
       T = тимін           
       R = G A (пурин)        
       Y = T C (піримідин)    
       K = G T (кето)    
       M = A C (аміно)
       S = G C (сильне зв'язування)
       W = A T (слабке зв'язування)
       B = G T C (всі крім A)
       D = G A T (всі крім C)
       H = A C T (всі крім G)
       V = G C A (всі крім T)
       N = A G C T (будь-який)

Див. також[ред.ред. код]

Сахарин Це незавершена стаття з молекулярної біології.
Ви можете допомогти проекту, виправивши або дописавши її.