Các thành phần cơ bản của ngôn ngữ C
Bộ chữ viết trong ngôn ngữ C bao gồm những ký tự, ký hiệu sau: (phân biệt chữ in hoa và in thường): 26 chữ cái latinh lớn A,B,C...Z 26 chữ cái latinh nhỏ a,b,c ...z. 10 chữ số thập phân 0,1,2...9. Các ký ...
Bộ chữ viết trong ngôn ngữ C bao gồm những ký tự, ký hiệu sau: (phân biệt chữ in hoa và in thường):
- 26 chữ cái latinh lớn A,B,C...Z
- 26 chữ cái latinh nhỏ a,b,c ...z.
- 10 chữ số thập phân 0,1,2...9.
- Các ký hiệu toán học: +, -, *, /, =, <, >, (, )
- Các ký hiệu đặc biệt: :. , ; " ' _ @ # $ ! ^ [ ] { } ...
- Dấu cách hay khoảng trống.
Từ khóa là các từ dành riêng (reserved words) của C mà người lập trình có thể sử dụng nó trong chương trình tùy theo ý nghĩa của từng từ. Ta không được dùng từ khóa để đặt cho các tên của riêng mình. Các từ khóa của Turbo C 3.0 bao gồm:
asm auto break case cdecl char
class const continue _cs default delete
do double _ds else enum _es
extern _export far _fastcall float for
friend goto huge if inline int
interrupt _loadds long near new operator
pascal private protected public register return
_saveregs _seg short signed sizeof _ss
static struct switch template this typedef
union unsigned virtual void volatile while
Khi viết chương trình đôi lúc ta cần phải có vài lời ghi chú về 1 đoạn chương trình nào đó để dễ nhớ và dễ điều chỉnh sau này; nhất là phần nội dung ghi chú phải không thuộc về chương trình (khi biên dịch phần này bị bỏ qua). Trong ngôn ngữ lập trình C, nội dung chú thích phải được viết trong cặp dấu /* và */.
Ví dụ :
#include <stdio.h>
#include<conio.h>
int main ()
{
char ten[50]; /* khai bao bien ten kieu char 50 ky tu */
/*Xuat chuoi ra man hinh*/
printf(“Xin cho biet ten cua ban !”);
scanf(“%s”,ten); /*Doc vao 1 chuoi la ten cua ban*/
printf(“Xin chao ban %s ”,ten);
printf(“Chao mung ban den voi Ngon ngu lap trinh C”);
/*Dung chuong trinh, cho go phim*/
getch();
return 0;
}
Các kiểu dữ liệu sơ cấp chuẩn trong C có thể được chia làm 2 dạng : kiểu số nguyên, kiểu số thực.
Kiểu số nguyên
Kiểu số nguyên là kiểu dữ liệu dùng để lưu các giá trị nguyên hay còn gọi là kiểu đếm được. Kiểu số nguyên trong C được chia thành các kiểu dữ liệu con, mỗi kiểu có một miền giá trị khác nhau
Kiểu số nguyên 1 byte (8 bits)
Kiểu số nguyên một byte gồm có 2 kiểu sau:
STT | Kiểu dữ liệu | Miền giá trị (Domain) |
1 | unsigned char | Từ 0 đến 255 (tương đương 256 ký tự trong bảng mã ASCII) |
2 | char | Từ -128 đến 127 |
Kiểu unsigned char: lưu các số nguyên dương từ 0 đến 255.
=> Để khai báo một biến là kiểu ký tự thì ta khai báo biến kiểu unsigned char. Mỗi số trong miền giá trị của kiểu unsigned char tương ứng với một ký tự trong bảng mã ASCII .
Kiểu char: lưu các số nguyên từ -128 đến 127. Kiểu char sử dụng bit trái nhất để làm bit dấu.
=> Nếu gán giá trị > 127 cho biến kiểu char thì giá trị của biến này có thể là số âm (?).
Kiểu số nguyên 2 bytes (16 bits)
Kiểu số nguyên 2 bytes gồm có 4 kiểu sau:
STT | Kiểu dữ liệu | Miền giá trị (Domain) |
1 | enum | Từ -32,768 đến 32,767 |
2 | unsigned int | Từ 0 đến 65,535 |
3 | short int | Từ -32,768 đến 32,767 |
4 | int | Từ -32,768 đến 32,767 |
Kiểu enum, short int, int : Lưu các số nguyên từ -32768 đến 32767. Sử dụng bit bên trái nhất để làm bit dấu.
=> Nếu gán giá trị >32767 cho biến có 1 trong 3 kiểu trên thì giá trị của biến này có thể là số âm.
Kiểu unsigned int: Kiểu unsigned int lưu các số nguyên dương từ 0 đến 65535.
Kiểu số nguyên 4 byte (32 bits)
Kiểu số nguyên 4 bytes hay còn gọi là số nguyên dài (long) gồm có 2 kiểu sau:
STT | Kiểu dữ liệu | Miền giá trị (Domain) |
1 | unsigned long | Từ 0 đến 4,294,967,295 |
2 | long | Từ -2,147,483,648 đến 2,147,483,647 |
Kiểu long : Lưu các số nguyên từ -2147483658 đến 2147483647. Sử dụng bit bên trái nhất để làm bit dấu.
=> Nếu gán giá trị >2147483647 cho biến có kiểu long thì giá trị của biến này có thể là số âm.
Kiểu unsigned long: Kiểu unsigned long lưu các số nguyên dương từ 0 đến 4294967295
Kiểu số thực
Kiểu số thực dùng để lưu các số thực hay các số có dấu chấm thập phân gồm có 3 kiểu sau:
STT | Kiểu dữ liệu | Kích thước (Size) | Miền giá trị (Domain) |
1 | float | 4 bytes | Từ 3.4 * 10-38 đến 3.4 * 1038 |
2 | double | 8 bytes | Từ 1.7 * 10-308 đến 1.7 * 10308 |
3 | long double | 10 bytes | Từ 3.4 *10-4932 đến 1.1 *104932 |
Mỗi kiểu số thực ở trên đều có miền giá trị và độ chính xác (số số lẻ) khác nhau. Tùy vào nhu cầu sử dụng mà ta có thể khai báo biến thuộc 1 trong 3 kiểu trên.
Ngoài ra ta còn có kiểu dữ liệu void, kiểu này mang ý nghĩa là kiểu rỗng không chứa giá trị gì cả.
Tên (danh biểu)
Tên hay còn gọi là danh biểu (identifier) được dùng để đặt cho chương trình, hằng, kiểu, biến, chương trình con... Tên có hai loại là tên chuẩn và tên do người lập trình đặt.
Tên chuẩn là tên do C đặt sẵn như tên kiểu: int, char, float,…; tên hàm: sin, cos...
Tên do người lập trình tự đặt để dùng trong chương trình của mình. Sử dụng bộ chữ cái, chữ số và dấu gạch dưới (_) để đặt tên, nhưng phải tuân thủ quy tắc:
- Bắt đầu bằng một chữ cái hoặc dấu gạch dưới.
- Không có khoảng trống ở giữa tên.
- Không được trùng với từ khóa.
- Độ dài tối đa của tên là không giới hạn, tuy nhiên chỉ có 31 ký tự đầu tiên là có ý nghĩa.
- Không cấm việc đặt tên trùng với tên chuẩn nhưng khi đó ý nghĩa của tên chuẩn không còn giá trị nữa.
Ví dụ: tên do người lập trình đặt: Chieu_dai, Chieu_Rong, Chu_Vi, Dien_Tich
Tên không hợp lệ: Do Dai, 12A2,…
Hằng (Constant)
Là đại lượng không đổi trong suốt quá trình thực thi của chương trình.
Hằng có thể là một chuỗi ký tự, một ký tự, một con số xác định. Chúng có thể được biểu diễn hay định dạng (Format) với nhiều dạng thức khác nhau.
Hằng số thực
Số thực bao gồm các giá trị kiểu float, double, long double được thể hiện theo 2 cách sau:
- Cách 1: Sử dụng cách viết thông thường mà chúng ta đã sử dụng trong các môn Toán, Lý, …Điều cần lưu ý là sử dụng dấu thập phân là dấu chấm (.);
Ví dụ: 123.34-223.3333.00-56.0
- Cách 2: Sử dụng cách viết theo số mũ hay số khoa học. Một số thực được tách làm 2 phần, cách nhau bằng ký tự e hay E
Phần giá trị: là một số nguyên hay số thực được viết theo cách 1.
Phần mũ: là một số nguyên
Giá trị của số thực là: Phần giá trị nhân với 10 mũ phần mũ.
Ví dụ: 1234.56e-3= 1.23456 (là số 1234.56 * 10-3)
-123.45E4 = -1234500 ( là -123.45 *104)
Hằng số nguyên
Số nguyên gồm các kiểu int (2 bytes) , long (4 bytes) được thể hiện theo những cách sau.
- Hằng số nguyên 2 bytes (int) hệ thập phân: Là kiểu số mà chúng ta sử dụng thông thường, hệ thập phân sử dụng các ký số từ 0 đến 9 để biểu diễn một giá trị nguyên.
Ví dụ: 123 ( một trăm hai mươi ba), -242 ( trừ hai trăm bốn mươi hai).
- Hằng số nguyên 2 byte (int) hệ bát phân: Là kiểu số nguyên sử dụng 8 ký số từ 0 đến 7 để biểu diễn một số nguyên.
Cách biểu diễn: 0<các ký số từ 0 đến 7>
Ví dụ : 0345 (số 345 trong hệ bát phân)
-020 (số -20 trong hệ bát phân)
Cách tính giá trị thập phân của số bát phân như sau:
Số bát phân : 0dndn-1dn-2…d1d0 ( di có giá trị từ 0 đến 7)
=> Giá trị thập phân= ∑i=0ndi∗8i size 12{ Sum cSub { size 8{i=0} } cSup { size 8{n} } {d rSub { size 8{i} } *8 rSup { size 8{i} } } } {}
0345=229 , 020=16
- Hằng số nguyên 2 byte (int) hệ thập lục phân: Là kiểu số nguyên sử dụng 10 ký số từ 0 đến 9 và 6 ký tự A, B, C, D, E ,F để biểu diễn một số nguyên.
Ký tự giá trị
A10
B11
C12
D13
E14
F15
Cách biểu diễn: 0x<các ký số từ 0 đến 9 và 6 ký tự từ A đến F>
Ví dụ:
0x345 (số 345 trong hệ 16)
0x20 (số 20 trong hệ 16)
0x2A9 (số 2A9 trong hệ 16)
Cách tính giá trị thập phân của số thập lục phân như sau:
Số thập lục phân : 0xdndn-1dn-2…d1d0 ( di từ 0 đến 9 hoặc A đến F)
=> Giá trị thập phân= ∑i=0ndi∗16i size 12{ Sum cSub { size 8{i=0} } cSup { size 8{n} } {d rSub { size 8{i} } *"16" rSup { size 8{i} } } } {}
0x345=827 , 0x20=32 , 0x2A9= 681
- Hằng số nguyên 4 byte (long): Số long (số nguyên dài) được biểu diễn như số int trong hệ thập phân và kèm theo ký tự l hoặc L. Một số nguyên nằm ngoài miền giá trị của số int ( 2 bytes) là số long ( 4 bytes).
Ví dụ: 45345L hay 45345l hay 45345
- Các hằng số còn lại: Viết như cách viết thông thường (không có dấu phân cách giữa 3 số)
Ví dụ:
12 (mười hai)
12.45 (mười hai chấm 45)
1345.67 (một ba trăm bốn mươi lăm chấm sáu mươi bảy)
Hằng ký tự
Hằng ký tự là một ký tự riêng biệt được viết trong cặp dấu nháy đơn (‘). Mỗi một ký tự tương ứng với một giá trị trong bảng mã ASCII. Hằng ký tự cũng được xem như trị số nguyên.
Ví dụ: ‘a’, ‘A’, ‘0’, ‘9’
Chúng ta có thể thực hiện các phép toán số học trên 2 ký tự (thực chất là thực hiện phép toán trên giá trị ASCII của chúng)
Hằng chuỗi ký tự
Hằng chuỗi ký tự là một chuỗi hay một xâu ký tự được đặt trong cặp dấu nháy kép (“).
Ví dụ: “Ngon ngu lap trinh C”, “Khoa CNTT-DHCT”, “NVLinh-DVHieu”
Chú ý:
1. Một chuỗi không có nội dung “” được gọi là chuỗi rỗng.
2. Khi lưu trữ trong bộ nhớ, một chuỗi được kết thúc bằng ký tự NULL (‘