티스토리 뷰

일반화학

SMILES (2): 규칙

영웅시대 2022. 3. 26. 09:21
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

규칙 1: 원자와 결합

SMILES는 주기율표의 모든 원소를 지원합니다. 원자는 각각의 원자 기호를 사용하여 표시됩니다. 대문자는 비방향족 원자를 나타냅니다. 소문자는 방향족 원자를 나타냅니다. 원자 기호에 둘 이상의 문자가 있는 경우 두 번째 문자는 소문자여야 합니다.

결합은 다음과 같이 표시됩니다.

 

- Single bond
= Double bond
# Triple bond
* Aromatic bond
. Disconnected structures

 

단일 결합은 기본값이므로 입력할 필요가 없습니다. 예를 들어, 'CC'는 단일 결합에 의해 다른 비방향족 탄소에 부착된 비방향족 탄소가 있다는 것을 의미하며, 컴퓨터는 그 구조를 화학적 에탄으로 식별합니다. 또한 두 개의 소문자 원자 기호 사이의 결합이 방향족이라고 가정합니다. 공백은 SMILES 문자열을 종료합니다.

 

규칙 2: 단순 사슬

원자 기호와 결합 기호를 결합하여 간단한 사슬 구조를 나타낼 수 있습니다. SMILES를 사용하여 입력된 구조는 수소가 억제되어 있습니다. 즉, 분자는 수소 없이 표시됩니다. SMILES 소프트웨어는 원자가 가질 수 있는 가능한 연결 수를 이해합니다. 사용자가 SMILES 표기법을 통해 충분한 결합을 식별하지 못하면 시스템은 자동으로 다른 연결이 수소 결합으로 충족된다고 가정합니다.

 

예제

CC CH3CH3 Ethane
C=C CH2CH2 Ethene
CBr CH3Br Bromomethane
C#N C=N Hydrocyanic acid
Na.Cl NaCl Sodium chloride

 

사용자는 수소 결합을 명시적으로 식별할 수 있지만 문자열에서 하나의 수소 결합이 식별되면 SMILES 해석기는 사용자가 해당 분자에 대한 모든 수소를 식별했다고 가정합니다.

 

HC(H)=C(H)(H) Ethene

 

SMILES는 주기율표의 모든 원소를 입력할 수 있고 수소 억제 기능을 활용하기 때문에 사용자는 컴퓨터에서 잘못 해석할 수 있는 두 글자의 화학 물질에 주의해야 합니다. 예를 들어, 'Sc'는 단일 결합으로 방향족 탄소에 연결된 황 원자로 해석되거나 스칸듐의 기호일 수 있습니다. SMILES 해석기는 황 원자와 방향족 탄소를 연결하는 단일 결합 해석에 우선 순위를 둡니다. 스칸듐을 식별하려면 [Sc]를 입력해야 합니다.

 

규칙 3: 가지

체인의 분기는 괄호 사이에 분기에 대한 SMILES 기호를 배치하여 지정됩니다. 괄호 안의 문자열은 연결된 원자 기호 바로 뒤에 배치됩니다. 이중 또는 삼중 결합으로 연결된 경우 결합 기호는 왼쪽 괄호 바로 다음에 옵니다.

몇 가지 예:

 

CC(O)C 2-Propanol
CC(=O)C 2-Propanone
CC(CC)C 2-Methylbutane
CC(C)CC(=O) 2-Methylbutanal
c1c(N(=O)=O)cccc1 Nitrobenzene
CC(C)(C)CC 2,2-Dimethylbutane

 

규칙 4: 링, 고리

SMILES를 사용하면 사용자가 숫자를 사용하여 고리 원자를 열고 닫는 것을 식별하여 고리 구조를 식별할 수 있습니다. 예를 들어, C1CCCCC1에서 첫 번째 탄소는 단일 결합으로 연결되는 숫자 '1'을 가지며 숫자 '1'도 있는 마지막 탄소와 연결됩니다. 결과 구조는 사이클로헥산입니다. 고리가 여러 개 있는 화학 물질은 고리마다 다른 번호를 사용하여 식별할 수 있습니다. 이중, 단일 또는 방향족 결합이 고리 폐쇄에 사용되는 경우 결합 기호는 고리 폐쇄 번호 앞에 배치됩니다. 

몇 가지 예:

 

or C=1CCCCC1 Cyclohexene
C*1*C*C*C*C*C1  
c1ccccc1 Benzene
C1OC1CC Ethyloxirane
c1cc2ccccc2cc1 Naphthalene

 

규칙 5: 전하를 띤 원자

원자의 전하는 SMILES 소프트웨어에 내장된 원자가에 관한 지식을 무시하는 데 사용할 수 있습니다. 하전된 원자를 식별하는 형식은 원자 다음에 원자의 전하를 묶는 괄호로 구성됩니다. 청구 횟수는 명시적으로 명시될 수도 있고({-1}) 그렇지 않을 수도 있습니다({-}).

 

예를 들어:

 

or

CCC(=O)O{-1} Ionized form of propanoic acid
CCC(=O)O{-}  
c1ccccn{+1}1CC(=O)O 1-Carboxylmethyl pyridinium

 

2022.03.26 - [일반화학] - SMILES (1): 튜토리얼

 

SMILES (1): 튜토리얼

SMILES 는 무엇인가요? SMILES(Simplified Molecular Input Line Entry System)는 사용자가 컴퓨터에서 사용할 수 있는 방식으로 화학 구조를 나타낼 수 있도록 하는 화학 표기법입니다. SMIL..

chemdb.tistory.com

References:

Anderson, E., G.D. Veith, and D. Weininger. 1987. SMILES: A line notation and computerized interpreter for chemical structures. Report No. EPA/600/M-87/021. U.S. Environmental Protection Agency, Environmental Research Laboratory-Duluth, Duluth, MN 55804

 

Hunter, R.S., F.D. Culver, and A. Fitzgerald. 1987. SMILES User Manual. A Simplified Molecular Input Line Entry System. Includes extended SMILES for defining fragments. Review Draft, Internal Report, Montana State University, Institute for Biological and Chemical Process Control (IPA), Bozeman, MT.

 

Weininger, D. 1988. SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules. Journal of Chemical Information and Computer Science 28: 31-36.

 

Weininger, D., A. Weininger, and J.L. Weininger. 1989. SMILES. 2. Algorithm for generation of unique SMILES notation. Journal of Chemical Information and Computer Science 29: 97-101.

 

출처: https://archive.epa.gov/med/med_archive_03/web/html/smiles.html

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함