티스토리 뷰
규칙 1: 원자와 결합
SMILES는 주기율표의 모든 원소를 지원합니다. 원자는 각각의 원자 기호를 사용하여 표시됩니다. 대문자는 비방향족 원자를 나타냅니다. 소문자는 방향족 원자를 나타냅니다. 원자 기호에 둘 이상의 문자가 있는 경우 두 번째 문자는 소문자여야 합니다.
결합은 다음과 같이 표시됩니다.
- | Single bond |
= | Double bond |
# | Triple bond |
* | Aromatic bond |
. | Disconnected structures |
단일 결합은 기본값이므로 입력할 필요가 없습니다. 예를 들어, 'CC'는 단일 결합에 의해 다른 비방향족 탄소에 부착된 비방향족 탄소가 있다는 것을 의미하며, 컴퓨터는 그 구조를 화학적 에탄으로 식별합니다. 또한 두 개의 소문자 원자 기호 사이의 결합이 방향족이라고 가정합니다. 공백은 SMILES 문자열을 종료합니다.
규칙 2: 단순 사슬
원자 기호와 결합 기호를 결합하여 간단한 사슬 구조를 나타낼 수 있습니다. SMILES를 사용하여 입력된 구조는 수소가 억제되어 있습니다. 즉, 분자는 수소 없이 표시됩니다. SMILES 소프트웨어는 원자가 가질 수 있는 가능한 연결 수를 이해합니다. 사용자가 SMILES 표기법을 통해 충분한 결합을 식별하지 못하면 시스템은 자동으로 다른 연결이 수소 결합으로 충족된다고 가정합니다.
예제
CC | CH3CH3 | Ethane |
C=C | CH2CH2 | Ethene |
CBr | CH3Br | Bromomethane |
C#N | C=N | Hydrocyanic acid |
Na.Cl | NaCl | Sodium chloride |
사용자는 수소 결합을 명시적으로 식별할 수 있지만 문자열에서 하나의 수소 결합이 식별되면 SMILES 해석기는 사용자가 해당 분자에 대한 모든 수소를 식별했다고 가정합니다.
HC(H)=C(H)(H) Ethene
SMILES는 주기율표의 모든 원소를 입력할 수 있고 수소 억제 기능을 활용하기 때문에 사용자는 컴퓨터에서 잘못 해석할 수 있는 두 글자의 화학 물질에 주의해야 합니다. 예를 들어, 'Sc'는 단일 결합으로 방향족 탄소에 연결된 황 원자로 해석되거나 스칸듐의 기호일 수 있습니다. SMILES 해석기는 황 원자와 방향족 탄소를 연결하는 단일 결합 해석에 우선 순위를 둡니다. 스칸듐을 식별하려면 [Sc]를 입력해야 합니다.
규칙 3: 가지
체인의 분기는 괄호 사이에 분기에 대한 SMILES 기호를 배치하여 지정됩니다. 괄호 안의 문자열은 연결된 원자 기호 바로 뒤에 배치됩니다. 이중 또는 삼중 결합으로 연결된 경우 결합 기호는 왼쪽 괄호 바로 다음에 옵니다.
몇 가지 예:
CC(O)C | 2-Propanol |
CC(=O)C | 2-Propanone |
CC(CC)C | 2-Methylbutane |
CC(C)CC(=O) | 2-Methylbutanal |
c1c(N(=O)=O)cccc1 | Nitrobenzene |
CC(C)(C)CC | 2,2-Dimethylbutane |
규칙 4: 링, 고리
SMILES를 사용하면 사용자가 숫자를 사용하여 고리 원자를 열고 닫는 것을 식별하여 고리 구조를 식별할 수 있습니다. 예를 들어, C1CCCCC1에서 첫 번째 탄소는 단일 결합으로 연결되는 숫자 '1'을 가지며 숫자 '1'도 있는 마지막 탄소와 연결됩니다. 결과 구조는 사이클로헥산입니다. 고리가 여러 개 있는 화학 물질은 고리마다 다른 번호를 사용하여 식별할 수 있습니다. 이중, 단일 또는 방향족 결합이 고리 폐쇄에 사용되는 경우 결합 기호는 고리 폐쇄 번호 앞에 배치됩니다.
몇 가지 예:
or | C=1CCCCC1 | Cyclohexene |
C*1*C*C*C*C*C1 | ||
c1ccccc1 | Benzene | |
C1OC1CC | Ethyloxirane | |
c1cc2ccccc2cc1 | Naphthalene |
규칙 5: 전하를 띤 원자
원자의 전하는 SMILES 소프트웨어에 내장된 원자가에 관한 지식을 무시하는 데 사용할 수 있습니다. 하전된 원자를 식별하는 형식은 원자 다음에 원자의 전하를 묶는 괄호로 구성됩니다. 청구 횟수는 명시적으로 명시될 수도 있고({-1}) 그렇지 않을 수도 있습니다({-}).
예를 들어:
or
CCC(=O)O{-1} | Ionized form of propanoic acid |
CCC(=O)O{-} | |
c1ccccn{+1}1CC(=O)O | 1-Carboxylmethyl pyridinium |
2022.03.26 - [일반화학] - SMILES (1): 튜토리얼
References:
Anderson, E., G.D. Veith, and D. Weininger. 1987. SMILES: A line notation and computerized interpreter for chemical structures. Report No. EPA/600/M-87/021. U.S. Environmental Protection Agency, Environmental Research Laboratory-Duluth, Duluth, MN 55804
Hunter, R.S., F.D. Culver, and A. Fitzgerald. 1987. SMILES User Manual. A Simplified Molecular Input Line Entry System. Includes extended SMILES for defining fragments. Review Draft, Internal Report, Montana State University, Institute for Biological and Chemical Process Control (IPA), Bozeman, MT.
Weininger, D. 1988. SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules. Journal of Chemical Information and Computer Science 28: 31-36.
Weininger, D., A. Weininger, and J.L. Weininger. 1989. SMILES. 2. Algorithm for generation of unique SMILES notation. Journal of Chemical Information and Computer Science 29: 97-101.
출처: https://archive.epa.gov/med/med_archive_03/web/html/smiles.html
'일반화학' 카테고리의 다른 글
[주기율표] 원소의 전자 배열 (0) | 2022.04.30 |
---|---|
[주기율표] 원자번호/원소기호/원소명/원자량 (0) | 2022.04.24 |
SMILES (1): 튜토리얼 (0) | 2022.03.26 |
웹에서 바로 화학구조식을 그릴수 있는 사이트 (Chemdraw 샘플) (0) | 2022.03.26 |
그래핀의 이론적 표면적 계산하기 (Calculation specific surface area of single graphene) (0) | 2022.03.01 |