24/05/2018, 20:28

Những cơ sở của ngôn ngữ C#

Trong chương này sẽ trình bày về hệ thống kiểu trong C#; phân biệt kiểu dựng sẵn ( int, lo n g, b o o l , … ) với các kiểu do người dùng định nghĩa. Ngoài ra, chương này cũng sẽ trình bày cách tạo và dùng biến, hằng; giới thiệu kiểu liệt kê, ...

Trong chương này sẽ trình bày về hệ thống kiểu trong C#; phân biệt kiểu dựng sẵn (int,long,bool,) với các kiểu do người dùng định nghĩa. Ngoài ra, chương này cũng sẽ trình bày cách tạo và dùng biến, hằng; giới thiệu kiểu liệt kê, chuỗi, kiểu định danh, biểu thức, và câu lệnh. Phần hai của chương trình bày về các cấu trúc điều kiện và các toán tử logic, quan hệ, toán học, …

C# buộc phải khai báo kiểu của đối tượng được tạo. Khi kiểu được khai báo rõ ràng, trình biên dịch sẽ giúp ngăn ngừa lỗi bằng cách kiểm tra dữ liệu được gán cho đối tượng có hợp lệ không, đồng thời cấp phát đúng kích thước bộ nhớ cho đối tượng.

C# phân thành hai loại: loai dữ liệu dựng sẵn và loại do người dùng định nghĩa.

C# cũng chia tập dữ liệu thành hai kiểu: giátrthamchiếu. Biến kiểu giá trị được lưu trong vùng nhớ stack, còn biến kiểu tham chiếu được lưu trong vùng nhớ heap.

C# cũng hỗ trợ kiểu con trỏ của C++, nhưng ít khi được sử dụng. Thông thường con trỏ chỉ được sử dụng khi làm việc trực tiếp với Win API hay các đối tượng COM.

Loại dữ liệu định sẳn

C# có nhiểu kiểu dữ liệu định sẳn, mỗi kiểu ánh xạ đến một kiểu được hổ trợ bởi CLS (Commom Language Specification), ánh xạ để đảm bảo rằng đối tượng được tạo trong C# không khác gì đối tượng được tạo trong các ngôn ngữ .NET khác Mỗi kiểu có một kích thước cố định được liệt kê trong bảng sau

Các kiểu dựng sẵn
Kiểu Kích thước(byte) Kiểu .Net Mô tả - giá trị
byte 1 Byte Không dấu (0..255)
char 1 Char Mã ký thự Unicode
bool 1 Boolean true hay false
sbyte 1 Sbyte Có dấu (-128 .. 127)
short 2 Int16 Có dấu (-32768 .. 32767)
ushort 2 Uint16 Không dấu (0 .. 65535)
int 4 Int32 Có dấu (-2147483647 .. 2147483647)
uint 4 Uint32 Không dấu (0 .. 4294967295)
float 4 Single Số thực (≈ ±1.5*10-45 .. ≈ ±3.4*1038)
double 8 Double Số thực (≈ ±5.0*10-324 .. ≈ ±1.7*10308)
decimal 8 Decimal số có dấu chấm tĩnh với 28 ký số và dấu chấm
long 8 Int64 Số nguyên có dấu (- 9223372036854775808 ..9223372036854775807)
ulong 8 Uint64 Số nguyên không dấu (0 .. 0xffffffffffffffff.)

Chọn một kiểu định sẵn

Tuỳ vào từng giá trị muốn lưu trữ mà ta chọn kiểu cho phù hợp. Nếu chọn kiểu quá lớn so với các giá trị cần lưu sẽ làm cho chương trình đòi hỏi nhiều bộ nhớ và chạy chậm. Trong khi nếu giá trị cần lưu lớn hơn kiểu thực lưu sẽ làm cho giá trị các biến bị sai và chương trình cho kết quả sai.

Kiểu char biểu diễn một ký tự Unicode. Ví dụ “u0041” là ký tự “A” trên bảng Unicode. Một số ký tự đặc biệt được biểu diễn bằng dấu “” trước một ký tự khác.

Các ký tự đặc biệt thông dụng
tự Nghĩa
dấu nháy đơn
dấu nháy đôi
dấu chéo ngược “”
Null
a Alert
 lùi về sau
f Form feed
xuống dòng
về đầu dòng
Tab ngang
v Tab dọc

Chuyển đổi kiểu định sẳn

Một đối tượng có thể chuyển từ kiểu này sang kiểu kia theo hai hình thức: ngầm hoặc tường minh. Hình thức ngầm được chuyển tự động còn hình thức tường minh cần sự can thiệp trực tiếp của người lập trình (giống với C++ và Java).

short x = 5;
    int y ;
    y = x; // chuyển kiểu ngầm định - tự động
    x = y; // lỗi, không biên dịch được
    x = (short) y; // OK

Biến dùng để lưu trữ dữ liệu. Mỗi biến thuộc về một kiểu dữ liệu nào đó.

Khởi tạo trước khi dùng

Trong C#, trước khi dùng một biến thì biến đó phải được khởi tạo nếu không trình biên dịch sẽ báo lỗi khi biên dịch. Ta có thể khai báo biến trước, sau đó khởi tạo và sử dụng; hay khai báo biến và khởi gán trong lúc khai báo.

int x; // khai báo biến trước
    x = 5; // sau đó khởi gán giá trị và sử dụng
    int y = x; // khai báo và khởi gán cùng lúc
    

Hằng

Hằng là một biến nhưng giá trị không thay đổi theo thời gian. Khi cần thao tác trên một giá trị xác định ta dùng hằng. Khai báo hằng tương tự khai báo biến và có thêm từ khóa const ở trước. Hằng một khi khởi động xong không thể thay đổi được nữa.

const int HANG_SO = 100;

Kiểu liệt kê

Enum là một cách thức để đặt tên cho các trị nguyên (các trị kiểu số nguyên, theo nghĩa nào đó tương tự như tập các hằng), làm cho chương trình rõ ràng, dễ hiểu hơn. Enum không có hàm thành viên. Ví dụ tạo một enum tên là Ngay như sau:

enum Ngay {Hai, Ba, Tu, Nam, Sau, Bay, ChuNhat};

Theo cách khai báo này enum ngày có bảy giá trị nguyên đi từ 0 = Hai, 1 = Ba, 2 = Tư … 7 = ChuNhat.

Sử dụng enum Ngay
using System; public class EnumTest { enum Ngay {Hai, Ba, Tu, Nam, Sau, Bay, ChuNhat }; public static void Main() { int x = (int) Ngay.Hai; int y = (int) Ngay.Bay; Console.WriteLine("Thu Hai = {0}", x); Console.WriteLine("Thu Bay = {0}", y); } }

Kết quả

Thu Hai = 0
    Thu Bay = 5

Mặc định enum gán giá trị đầu tiên là 0 các trị sau lớn hơn giá trị trước một đơn vị, và các trị này thuộc kiểu int. Nếu muốn thay đổi trị mặc định này ta phải gán trị mong muốn .

Sử dụng enum Ngay (2)
using System; namespace ConsoleApplication { enum Ngay: byte { Hai=2,Ba,Tu,Nam,Sau,Bay,ChuNhat=10 }; class EnumTest { static void Main(string[] args) { byte x = (byte)Ngay.Ba; byte y = (byte)Ngay.ChuNhat; Console.WriteLine("Thu Ba = {0}", x); Console.WriteLine("Chu Nhat = {0}", y); Console.Read(); } } }

Kết quả:

Thu Ba = 3
    Chu Nhat = 10

Kiểu enum ngày được viết lại với một số thay đổi, giá trị cho Hai là 2, giá trị cho Ba là 3 (Hai + 1) …, giá trị cho ChuNhat là 10, và các giá trị này sẽ là kiểu byte.

Cú pháp chung cho khai báo một kiểu enum như sau

[attributes] [modifiers] enum identifier [:base-type]
    {
     enumerator-list
    };

modifiers (tùy chọn): public, protected, internal, private (các bổ từ xác định phạm vi truy xuất)

identifer: tên của enum

base_type (tùy chọn): kiểu số, ngoại trừ char

enumerator-list: danh sách các thành viên.

Chuỗi

Chuỗi là kiểu dựng sẵn trong C#, nó là một chuổi các ký tự đơn lẻ. Khi khai báo một biến chuỗi ta dùng từ khoá string. Ví dụ khai báo một biến string lưu chuỗi "Hello World"

string myString = "Hello World";

Định danh

Định danh là tên mà người lập trình chọn đại diện một kiểu, phương thức, biến, hằng, đối tượng… của họ. Định danh phải bắt đầu bằng một ký tự hay dấu “

_
”. Định danh không được trùng với từ khoá C# và phân biệt hoa thường.

Bất kỳ câu lệnh định lượng giá trị được gọi là một biểu thức (expression). Phép gán sau cũng được gọi là một biểu thức vì nó định lượng giá trị được gán (là 32)

x = 32;

vì vậy phép gán trên có thể được gán một lần nữa như sau

y = x = 32;

Sau lệnh này y có giá trị của biểu thức x = 32 và vì vậy y = 32.

Trong C#, khoảng trống, dấu tab, dấu xuống dòng đều được xem là khoảng trắng (whitespace). Do đó, dấu cách dù lớn hay nhỏ đều như nhau nên ta có:

x = 32;

cũng như

x =                                            32;

Ngoại trừ khoảng trắng trong chuỗi ký tự thì có ý nghĩa riêng của nó.

Cũng như trong C++ và Java một chỉ thị hoàn chỉnh thì được gọi là một câu lệnh (statement). Chương trình gồm nhiều câu lệnh, mỗi câu lệnh kết thúc bằng dấu “;”.

int x ;// là một câu lệnh
        x = 23; // là một lệnh khác
 

Ngoài các câu lệnh bình thường như trên, có các câu lệnh khác là: lệnh rẽ nhánh không điều kiện, rẽ nhánh có điều kiện và lệnh lặp.

Các lệnh rẽ nhánh không điều kiện

Có hai loại câu lệnh rẽ nhánh không điều kiện. Một là lệnh gọi phương thức: khi trình biên dịch thấy có lời gọi phương thức nó sẽ tạm dừng phương thức hiện hành và nhảy đến phương thức được gọi cho đến hết phương thức này sẽ trở về phương thức cũ.

Gọi một phương thức
using System;
class Functions
{
static void Main( )
{
Console.WriteLine("In Main! Calling SomeMethod( )..."); SomeMethod( );
Console.WriteLine("Back in Main( ).");
}
static void SomeMethod( )
{
Console.WriteLine("Greetings from SomeMethod!");
}
}

Kết quả:

In Main! Calling SomeMethod( )...
Greetings from SomeMethod! Back in Main( ).

Cách thứ hai để tạo các câu lệnh rẽ nhánh không điều kiện là dùng từ khoá: goto, break, continue, return, hay throw. Cách từ khóa này sẽ được giới thiệu trong các phần sau.

Lệnh rẽ nhánh có điều kiện

Các từ khóa if-else, while, do-while, for, switch-case, dùng để điều khiển dòng chảy chương trình. C# giữ lại tất cả các cú pháp của C++, ngoại trừ switch có vài cải tiến.

Lệnh If .. else …

Cú pháp:

if ( biểu thức logic )
    khối lệnh;
    

hoặc

if ( biểu thức logic )
    khối lệnh 1;
    else
    khối lệnh 2;

Khối lệnh là một tập các câu lện trong cặp dấu "

 {...}
" .Bất kỳ nơi đâu có câu lệnh thì ở đó có thể viết bằng một khối lệnh.

Biểu thức logic là biểu thức cho giá trị dúng hoặc sai (true hoặc false). Nếu “biểu thức logic” cho giá trị đúng thì “khối lệnh” hay “khối lệnh 1” sẽ được thực thi, ngược lại “khối lệnh 2” sẽ thực thi. Một điểm khác biệt với C++ là biểu thức trong câu lệnh if phải là biểu thức logic, không thể là biểu thức số.

Lệnh switch

Cú pháp:

switch ( biểu_thức_lựa_chọn )
    {
     case biểu_thức_hằng :
    khối lệnh;
    lệnh nhảy;
    [ default : khối lệnh; lệnh nhảy; ]
     }

Biểu thức lựa chọn là biểu thức sinh ra trị nguyên hay chuỗi. Switch sẽ so sánh biểu_thức_lựa_chọn với các biểu_thức_hằng để biết phải thực hiện với khối lệnh nào. Lệnh nhảy như break, goto…để thoát khỏi câu switch và bắt buộc phải có.

int nQuyen = 0;
switch ( sQuyenTruyCap )
{
case "Administrator":
nQuyen = 1;
break;
case "Admin":
goto case "Administrator";
default:
nQuyen = 2;
break;
}

Lệnh lặp

C# cung cấp các lệnh lặp giống C++ như for, while, do-while và lệnh lặp mới foreach. Nó cũng hổ trợ các câu lệnh nhảy như: goto, break, continuereturn.

Lệnh goto

Lệnh gotocó thể dùng để tạo lệnh nhảy nhưng nhiều nhà lập trình chuyên nghiệp khuyên không nên dùng câu lệnh này vì nó phá vỡ tính cấu trúc của chương trình. Cách dùng câu lệnh này như sau: (giống như trong C++)

1. Tạo một nhãn

2. goto đến nhãn đó.

Vòng lặp while

Cú pháp:

while ( biểu_thức_logic )
    khối_lệnh;
    

Khối_lệnh sẽ được thực hiện cho đến khi nào biểu thức còn đúng. Nếu ngay từ đầu biểu thức sai, khối lệnh sẽ không được thực thi.

Vòng lặp do … while

Cú pháp:

Do
khối_lệnh
    while ( biếu_thức_logic )
    

Khác với while khối lệnh sẽ được thực hiện trước, sau đó biệu thức được kiểm tra. Nếu biểu thức đúng khối lệnh lại được thực hiện.

Vòng lặp for

Cú pháp:

for ( [khởi_tạo_biến_đếm]; [biểu_thức]; [gia_tăng_biến_đếm] )
    khối lệnh;
    
Tính tổng các số nguyên từ a đến b
int a = 10; int b = 100; int nTong = 0;
for ( int i = a; i <= b; i++ )
{
nTong += i;
}

Câu lệnh break, continue, và return

Cả ba câu lệnh break, continue, và return rất quen thuộc trong C++ và Java, trong C#, ý nghĩa và cách sử dụng chúng hoàn toàn giống với hai ngôn ngữ này.

Các phép toán +, -, *, / là một ví dụ về toán tử. Áp dụng các toán tử này lên các biến kiểu số ta có kết quả như việc thực hiện các phép toán thông thường.

int a = 10;
int b = 20;
int c = a + b; // c = 10 + 20 = 30

C# cung cấp cấp nhiều loại toán tử khác nhau để thao tác trên các kiểu biến dữ liệu, được liệt kê trong bảng sau theo từng nhóm ngữ nghĩa.

Các nhóm toán tử trong C#
Nhóm toán tử Toán tử Ý nghĩa
Toán học + - * / % cộng , trừ, nhân chia, lấy phần dư
Logic & | ^ ! ~ && || true false phép toán logic và thao tác trên bit
Ghép chuỗi + ghép nối 2 chuỗi
Tăng, giảm ++, -- tăng / giảm toán hạng lên / xuống 1. Đứng trước hoặc sau toán hạng.
Dịch bit << >> dịch trái, dịch phải
Quan hệ == != < > <= >= bằng, khác, nhỏ/lớn hơn, nhỏ/lớn hơn hoặc bằng
Gán = += -= *= /= %= &=|= ^= <<= >>= phép gán
Chỉ số [] cách truy xuất phần tử của mảng
Ép kiểu ()
Indirection vàAddress * -> [] & dùng cho con trỏ

Toán tử gán (=)

Toán tử này cho phép thay đổi các giá trị của biến bên phải toán tử bằng giá trị bên trái toán tử.

Nhóm toán tử toán học

C# dùng các toàn tử số học với ý nghĩa theo đúng tên của chúng như: + (cộng), – (trừ) , * (nhân) và / (chia). Tùy theo kiểu của hai toán hạng mà toán tử trả về kiểu tương ứng. Ngoài ra, còn có toán tử %(lấy phần dư) được sử dụng trong các kiểu số nguyên.

Các toán tử tăng và giảm

C# cũng kế thừa từ C++ và Java các toán tử: +=,-=, *=, /= , %= nhằm làm đơn giản hoá. Nó còn kế thừa các toán tử tintốhậut(như biến++, hay ++biến) để giảm bớt sự cồng kềnh trong các toán tử cổ điển.

Các toán tử quan hệ

Các toán tử quan hệ được dùng để so sánh hai giá trị với nhau và kết quả trả về có kiểu Boolean. Toán tử quan hệ gồm có:

 ==
(so sánh bằng),
 !=
(so sánh khác),
 >
(so sánh lớn hơn),
>=
(lớn hơn hay bằng),
< 
(so sánh nhỏ hơn),
<=
(nhỏ hơn hay bằng).

Các toán tử logic

Các toán tử logic gồm có:

&&
(),
||
(hoặc),
 !
(phđnh). Các toán tử này được dùng trong các biểu thức điều kiện để kết hợp các toán tử quan hệ theo một ý nghĩa nhất định.

Thứ tự các toán tử

Đối với các biểu thức toán, thứ tự ưu tiên là thứ tự được qui định trong toán học. Còn thứ tự ưu tiên thực hiện của các nhóm toán tử được liệt kê theo bảng dưới đây

Thứ tự ưu tiên của các nhóm toán tử (chiều ưu tiên từ trên xuống dưới)
Nhóm toán tử Toán tử Ý nghĩa
Primary (chính) {x} x.y f(x) a[x] x++x--
Unary + - ! ~ ++x –x (T)x
Nhân * / % Nhân, chia, lấy phần dư
Cộng + - cộng, trù
Dịch bít << >> Dịch trái, dịch phải
Quan hệ < > <= >= is nhỏ hơn, lớn hơn, nhỏ hơn hay bằng, lớn hơn hay bằng và
Bằng == != bằng, khác
Logic trên bit AND & Vàtrên bit.
XOR ^ Xor trên bit
OR | hoctrên bit
Điều kiện AND && Vàtrên biểu thức điều kiện
Điều kiện OR || Hoặctrên biểu thức điều kiện
Điều kiện ?: điềukiệntương tự if
Assignment = *= /= %= += -= <<==>> &= ^= |=

Toán tử tam phân

Cú pháp:

<biểu thức điều kiện>? <biểu thức 1>: <biểu thức 2>;

Ý nghĩa:

Nếu biểu thức điều kiện đúng thì thực hiện biểu thức 1. Nếu sai thì thực hiện biểu thức 2.

Như đã có giải thích trong phân tích ví dụ HelloWorld, vùng tên là một cách tổ chức mã nguồn thành các nhóm có ngữ nghĩa liên quan. Ví dụ:

Trong mô hình kiến trúc 3 lớp (3 tầng, tiếng Anh là 3 – tier Architecture) chia một ứng dụng ra thành 3 tầng: tầng giao diện, tầng nghiệp vụ và tầng dữ liệu (Presentation, Bussiness và Data). Ta có thể chia dự án thành 3 vùng tên tương ứng: Presentation, Bussiness và Data. Các vùng tên này chứa các lớp thuộc về tầng của mình.

Một vùng tên chứa các lớp và các vùng tên con khác. Vậy trong ví dụ trên ta sẽ tạo một vùng tên chung cho ứng dụng là MyApplication và ba vùng tên kia sẽ là ba vùng tên con của vùng tên MyApplication. Cách này giải quyết được trường hợp nếu ta có nhiều dự án mà chỉ có 3 vùng tên và dẫn đến việc không biết một lớp thuộc vùng tên Data nhưng không biết thuộc dự án nào.

Vùng tên con được truy xuất thông qua tên vùng tên cha cách nhau bằng dấu chấm.

Để khai báo vùng tên ta sử dụng từ khóa namespace. Ví dụ dưới đây là 2 cách khai báo các vùng tên trong ví dụ ở trên.

Cách 1
namespace MyApplication { namespace Presentation { // khai báo lớp // khai báo vùng tên con } namespace Bussiness { // khai báo lớp // khai báo vùng tên con } namespace Data { // khai báo lớp // khai báo vùng tên con } }
Cách 2
namespace MyApplication.Presentation { // khai báo lớp // khai báo vùng tên con } namespace MyApplication.Bussiness { // khai báo lớp // khai báo vùng tên con } namespace MyApplication.Data { // khai báo lớp // khai báo vùng tên con }

Cách khai báo vùng tên thứ nhất chỉ tiện nếu các vùng tên nằm trên cùng một tập tin. Cách thứ hai tiện lợi hơn khi các vùng tên nằm trên nhiều tập tin khác nhau.

Không phải mọi câu lệnh đều được biên dịch cùng lúc mà có một số trong chúng được biên dịch trước một số khác. Các câu lệnh như thế này gọi là các chỉ thị tiền xủ lý . Các chỉ thị tiền xử lý được đặt sau dấu #.

Định nghĩa các định danh

#define DEBUG
định nghĩa một định danh tiền xử lý (preprocessor identifier) DEBUG. Mặc dù các chỉ thị tiền xử lý có thể định nghĩa ở đâu tuỳ thích nhưng định danh tiền xử lý bắt buộc phải định nghĩa ở đầu của chương trình, trước cả từ khóa using. Do đó, ta cần trình bày như sau:
#define DEBUG
//... mã nguồn bình thường - không ảnh hưởng bởi bộ  tiền xử  lý
#if DEBUG
// mã nguồn được bao gồm trong chương trình
// khi chạy dưới chế  độ  debug
#else
// mã nguồn được bao gồm trong chương trình
// khi chạy dưới chế  độ  không debug
#endif
//... các đoạn mã nguồn không ảnh hưởng tiền xử  lý

Trình biên dịch nhảy đến các đoạn thoả điều kiện tiền biên dịch để biên dịch trước.

Hủy một định danh

Ta hủy một định danh bằng cách dùng

#undef
. Bộ tiền xử lý duyệt mã nguồn từ trên xuống dưới, nên định danh được định nghĩa từ
#define
, hủy khi gặp
#undef
hay đến hết chương trình. Ta sẽ viết là:
#define DEBUG
#if DEBUG
   // mã nguồn được biên dịch
#endif
#undef DEBUG
#if DEBUG
  // mã nguồn sẽ  không được biên dịch
#endif

#if, #elif, #else và #endif

Đây là các chỉ thị để chọn lựa xem có tiền biên dịch hay không. Các chỉ thị trên có ý nghĩa tương tự như câu lệnh điều kiện if-else. Quan sát ví dụ sau:

#if DEBUG
// biên dịch đoạn mã này nếu DEBUG được định nghĩa
#elif TEST
// biên dịch đoạn mã này nếu DEBUG không được định nghĩa
// nhưng TEST được định nghĩa
#else
// biên dịch đoạn mã này nếu DEBUG lẫn TEST
// không được định nghĩa
#endif

Chỉ thị #region và #endregion

Chỉ thị phục vụ cho các công cụ IDE như VS.NET cho phép mở/đóng các ghi chú.

#region Đóng mở  một đoạn mã
// mã nguồn
#endregion

khi này VS.NET cho phép đóng hoặc mở vùng mã này. Ví dụ trên đang ở trạng thái mở. Khi ở trạng thái đóng nó như sau

0