如何用生物密码子编码表白“I LOVE U”

2024-05-14

1. 如何用生物密码子编码表白“I LOVE U”

520无聊科普贴:如何用生物密码子编码表白“I LOVE U”

本文源起是今天看到微博上某网站搞了个理工宅520三行情书大赛,其中某位应该是学生物的 gg 用密码子拼了个 MEET, ATTRACTED, STOP;不由嗟叹专业劣势,想说个简单的 I LOVE U 都那么难;结合几个月前偶然泡维基所得,成此文。
首先要声明:本文非常蛋疼、实际基本毫无用处;因为标题提出的需求基本不可能存在,万一需求存在也基本不可能付诸实施,万一中的万一真的付诸实施了的话……基本也不可能有成功结果;万一中的万一中的万一结果是洗具的话,那相信和本文内容完全无关也能成功。

大部分人都听说过氨基酸;学生物、医学、化学类似专业的应该还会知道有20种常见标准氨基酸,并且每种氨基酸有三字母缩写和单字母缩写。然后这些氨基酸是由 mRNA 上相邻三个标准核苷酸构成的密码子编码的,标准核苷酸共4种(A、C、G、U),三核苷酸组合共64种。每个氨基酸对应的密码子数量为1-6个不等,此外还有三个密码子组合不编码任何氨基酸,只代表终止信号。
所以,26个英文字母中,有20个对应了常见标准氨基酸。至于怎么对应的,还有密码子都是哪些,自己谷歌去。
生化课上得认真些的家伙也许还记得有两个简并氨基酸缩写:天冬氨酸/天冬酰胺 或者 Asp/Asn 或者 D/N 可以用 Asx 或者 B 表示,谷氨酸/谷氨酰胺 或者 Glu/Gln 或者 E/Q 可以用 Glx 或者 Z 表示,
于是就有22个字母可以用了。

然后就有了用三字母缩写或者用密码子指代单字母的生物宅密码系统。例如:HAPPY BIRTHDAY = His-Ala-Pro-Pro-Tyr Asx-Ile-Arg-Thr-His-Asp-Ala-Tyr = CAUUAUCCUCCUUAU RAUAUUAGACAUGAUGCUUAU (密码子是诸多选择之一)。有人拿这来搞个院衫啊什么,觉得这东东不普通,很文艺;嗯,可能是吧。
当然有个别人选择用中文指代单字母,例如上面这行是 组氨酰丙氨酰脯氨酰脯氨酰酪氨酸 天冬氨(酰胺)酰异亮氨酰精氨酰苏氨酰组氨酰天冬氨酰丙氨酰酪氨酸。私人评价,这不太普通,也不太文艺。
(注:上面密码子里那个 R 表示核苷酸 A/G 的简并,也就是 RAU 同时代表了 AAU/GAU,正好编码简并氨基酸 D/N = B;类似的,SAA = CAA/GAA 可以编码 E/Q = Z。类似 R 和 S 这样的核苷酸简并字母也还有一些(共16个字母被占用),另外也有些非常见核苷酸有单字母缩写,不过这都就和本文主题——氨基酸的单字母缩写——无关了;具体也请自行谷歌。)
基本上差不多了,用生物密码子写英文就是这么简(dan)单(teng)。

问题是:上面的氨基酸单字母缩写相对字母表仍然少掉了四个:J、O、U、X。一前一后的 J 和 X 问题不大,英文使用极少。虽然有时候需要用拼音来拼对方中文姓名,但真有这个需求的话也可以考虑用英文名代替——什么,你要用蕴含着演化论信息的密码子向一个叫 J. X. (Jesus Xmas)的男人告白?算我啥也没说过。
此外其实玩蛋白晶体学的早就在用 J 或 Xle 代表 L/I 也就是 Leu/Ile 也就是 亮氨酸/异亮氨酸 这一对了;然后还有就是,大家普遍默认用 X 代表未知氨基酸。
也就是说,至此24个字母已经OK了。密码子的话,可以用 MUU = AUU/CUU 编码 J,NNN(N 是普遍默认代表未知核苷酸的字母)编码 X。

但是最后两个字母的缺席,简直要了亲命——它们都是元音字母,没有它们,一大堆英文单词都拼不完整了。
所谓世上无难事,只怕有dan人。有人发现了第21种标准氨基酸:硒半胱氨酸 selenocysteine,mRNA 上原本表示终止信号的 UGA 编码在一个叫做 SECIS 的特定元件存在时改为编码这个第21种氨基酸。硒半胱氨酸的三字母缩写是 Sec,单字母一开始模仿发音最后一个字母用 X。不过这个 X 和习惯代表“未知”的 X 冲突了,于是1999年国际纯粹与应用化学联合会(IUPAC)和国际生物化学与分子生物学联合会(IUBMB)

如何用生物密码子编码表白“I LOVE U”

最新文章
热门文章
推荐阅读