Chất lượng dịch vụ cho VoIP
Chất lượng dịch vụ QoS là tập hợp các chỉ tiêu đặc trưng cho yêu cầu của từng loại lưu lượng cụ thể trên mạng bao gồm: độ trễ, jitter, tỷ lệ mất gói... Các chỉ tiêu này liên quan đến lượng băng thông dành cho mạng. Có nhiều biện pháp ...
Chất lượng dịch vụ QoS là tập hợp các chỉ tiêu đặc trưng cho yêu cầu của từng loại lưu lượng cụ thể trên mạng bao gồm: độ trễ, jitter, tỷ lệ mất gói... Các chỉ tiêu này liên quan đến lượng băng thông dành cho mạng.
Có nhiều biện pháp nhằm đảm bảo QoS được thực hiện. Để tối thiểu thời gian trễ của các gói thoại so với các gói của các dịch vụ khác, các gói thoại được truyền bởi giao thức UDP (User Datagram Protocol). Giao thức này không cung cấp cơ chế truyền lại do vậy gói thoại sẽ được xử lý nhanh hơn. Để loại bỏ tiếng vọng người ta sử dụng bộ triệt tiếng vọng ở các gateway. Và còn có các biện pháp sau:
- Nén tín hiệu thoại.
- Các cơ chế đảm bảo chất lượng dịch vụ tại các nút mạng: Các thuật toán xếp hàng (queuing), cơ chế định hình lưu lượng (traffic shapping), các cơ chế tối ưu hoá đường truyền, các thuật toán dự đoán và tránh tắc nghẽn,...
- Phương thức báo hiệu QoS.
Chính sách QoS có vạch ra mong muốn thực hiện nhiệm vụ quản lý chất lượng dịch vụ theo một kế hoạch cụ thể và thông qua hệ thống báo hiệu QoS để ra lệnh cho các cơ chế chấp hành tại các nút mạng thực hiện nhiệm vụ đó.
Nén tín hiệu thoại: Trong mạng điện thoại thông thường tín hiệu thoại được mã hoã PCM theo luật A hoặc Muy với tốc độ 64Kbps. Với cách mã hoá này cho phép khôi phục một cách tương đối trung thực các âm thanh trong giải tần tiếng nói. Tuy nhiên trong một số ứng dụng đặc biệt yêu cầu truyền âm thanh với tốc độ thấp hơn ví dụ như truyền tín hiệu thoại trên mạng Internet. Từ đó đã xuất hiện một số kỹ thuật mã hoá và nén tín hiệu tiếng nói xuống tốc độ thấp cụ thể như G.723.1, G.729, G729A, và GSM. G.729 được ITU-T phê chuẩn vào năm 1995. Mặc dù đã được ITU phê chuẩn hoá, diễn đàn VoIP năm 1997 đã thoả thuận đề xuất G.723.1 thay thế cho G.729. Tổ hợp công nghiệp trong đó dẫn đầu là Intel và Microsoft đã chấp nhận hi sinh một chút chất lượng âm thanh để đạt được hiệu quả băng thông lớn hơn. Thật vậy, G.723.1 yêu cầu 5,3/6,3 kbps trong khi G.729 yêu cầu 8 kbps. Việc công nhận tiêu chuẩn nén và giải nén là một bước tiến quan trọng trong việc cải thiện độ tin cậy và chất lượng âm thanh.
Về cơ bản các bộ mã hoá tiếng nói có ba loại: mã hoá dạng sóng (wave form), mã hoá nguồn (source) và mã hoá lai (hybrid) (nghĩa là kết hợp cả hai loại mã hoá dạng trên).
Nguyên lý bộ mã hoá dạng sóng là mã hoá dạng sóng của tiếng nói. Tại phía phát, bộ mã hóa sẽ nhận các tín hiệu tiếng nói tương tự liên tục và mã thành tín hiệu số trước khi truyền đi. Tại phía thu sẽ làm nhiệm vụ ngược lại để khôi phục tín hiệu tiếng nói. Khi không có lỗi truyền dẫn thì dạng sóng của tiếng nói khôi phục sẽ rất giống với dạng sóng của tiếng nói gốc. Cơ sở của bộ mã hoã dạng sóng là: Nếu người nghe nhận được một bản sao dạng sóng của tiếng nói gốc thì chất lượng âm thanh sẽ rất tuyệt vời. Tuy nhiên, trong thực tế, quá trình mã hoá lại sinh ra tạp âm lượng tử (mà thực chất là một dạng méo dạng sóng), song tạp âm lượng tử thường đủ nhỏ để không ảnh hưởng đến chất lượng tiếng nói thu được. ưu điểm của bộ mã hoá loại này là: độ phức tạp, giá thành thiết kế, độ trễ và công suất tiêu thụ thấp. Người ta có thể áp dụng chúng để mã hoá các tín hiệu khác như: tín hiệu báo hiệu, số liệu ở dải âm thanh và đăc biệt với những thiết bị ở điều kiện nhất định thì chúng còn có khả năng mã hoá được cả tín hiệu âm nhạc. Bộ mã hoá dạng sóng đơn giản nhất là điều xung mã (PCM), điều chế Delta (DM)... Tuy nhiên, nhược điểm của bộ mã hoá dạng sóng là không tạo được tiếng nói chất lượng cao tại tốc độ bit dưới 16kbit/s, mà điều này được khắc phục ở bộ mã hoá nguồn.
Nguyên lý của mã hoá nguồn là mã hoá kiểu phát âm (vocoder), ví dụ như bộ mã hoá dự báo tuyến tính (LPC). Các bộ mã hoá này có thể thực hiện được tại tốc độ bít cỡ 2kbps. Hạn chế chủ yếu của bộ mã hoá kiểu phát âm LPC là giả thiết rằng: tín hiệu tiếng nói bao gồm cả âm hữu thanh và âm vô thanh. Do đó với âm hữu thanh thì nguồn kích thích bộ máy phát âm sẽ là một dãy các xung, còn với các âm vô thanh thì nó sẽ là một nguồn nhiễu ngẫu nhiên. Trong thực tế có rất nhiều cách để kích thích cơ quan phát âm. Và để đơn giản hoá, người ta giả thiết rằng chỉ có một điểm kích thích trong toàn bộ giai đoạn lên giọng của tiếng nói, dù cho đó là âm hữu thanh.
Có rất nhiều phương pháp mô hình hoá sự kích thích: Phương pháp kích thích đa xung (MPE), phương pháp kích thích xung đều (RPE), phương pháp dự đoán tuyến tính kích thích mã (CELP). Phần này sẽ tập trung chủ yếu giới thiệu phương pháp dự đoán tuyến tính kích thích mã CELP. Hiện nay phương pháp này đã trở thành công nghệ chủ yếu cho mã hoá tiếng nói tốc độ thấp.
Nguyên lý chung của bộ mã hoá CELP: Phương pháp CELP có nhược điểm là có một thủ tục đòi hỏi tính toán nhiều nên khó có thể thực hiện trong thời gian thực. Vậy có một phương pháp làm đơn giản hoá thủ tục soát bảng mã sao cho không ảnh hưởng tới chất lượng tiếng nói. Đó là phương pháp sử dụng các bảng mã đại số ACELP (Algebraic CELP) trong đó các bảng mã được tạo ra nhờ các mã sửa lỗi nhị phân đặc biệt. Và để nâng cao hiệu quả rà soát bảng mã, người ta sử dụng các bảng mã đại số có cấu liên kết CS-ACELP (Conjugate-Structure ACELP). Khuyến nghị G729 đưa ra nguyên lý của bộ mã hóa tiếng nói sử dụng phương pháp CS-ACELP mã hoá tiếng nói tốc độ 8kbps.
Nguyên lý mã hoá CS-ACELP: Tín hiệu PCM 64kbps đầu vào được đưa qua bộ mã hoá thuật toán CS-ACELP, được lấy mẫu tại tần số 8kHz, sau đó qua bộ chuyển đổi thành tín hiệu PCM đều 16 bit đưa tới đầu vào bộ mã hoá. Tín hiệu đầu ra bộ giải mã sẽ được chuyển đổi thành tín hiệu PCM theo đúng tín hiệu đầu vào. Các đặc tính đầu vào/đầu ra khác, giống như của tín hiệu PCM 64kbps (theo khuyến nghị ITU G.711), sẽ được chuyển đổi thành tín hiệu PCM đều 16 bit tại đầu vào bộ mã hoá.
Bộ mã hoá CS-ACELP dựa trên cơ sở của bộ mã dự báo tuyến tính kích thích mã CELP.
Bộ mã hoá CS-ACELP thực hiện trên các khung tiếng nói chu kỳ 10ms tương đương 80 mẫu tại tốc độ lấy mẫu là 8000 mẫu/s. Cứ mỗi một khung 10ms, tín hiệu tiếng nói lại được phân tích để lấy các tham số của bộ mã CELP (đó là các tham số của bộ lọc dự báo thích ứng, chỉ số các bảng mã cố định và bảng mã thích ứng cùng với các tăng ích của bảng mã). Các tham số này sẽ được mã hoá và truyền đi.
Tại phía thu, các tham số này sẽ được sử dụng để khôi phục các tham số tín hiệu kích thích và các tham số của bộ lọc tổng hợp. Tín hiệu tiếng nói sẽ được khôi phục bằng cách lọc các tham số tín hiệu kích thích này thông qua bộ lọc tổng hợp ngắn hạn. Bộ lọc tổng hợp ngắn hạn dựa trên cơ sở bộ lọc dự báo tuyến tính LP bậc 10. Bộ lọc tổng hợp dài hạn, hay bộ lọc tổng hợp độ cao dùng cho việc làm tròn mã thích ứng. Sau khi khôi phục, nhờ bộ lọc sau tiếng nói sẽ được làm tăng độ trung thực.
Chuẩn nén G.729A: G729A là thuật toán mã hoá tiếng nói tiêu chuẩn cho thoại và số liệu đồng thời số hoá (DSVD). G.729A là sự trao đổi luồng bit với G.729, có nghĩa là tín hiệu được mã hoá bằng thuật toán G.729A có thể được giải mã thông qua thuật toán G.729 và ngược lại. Giống như G.729, nó sử dụng thuật toán dự báo tuyến tính mã kích thích đại số được cấu trúc liên kết (CS-ACELP) với các khung 10ms. Tuy nhiên một vài thuật toán thay đổi sẽ được giới thiệu mà kết quả của các thuật toán này làm giảm 50% độ phức tạp.
Nguyên lý chung của bộ mã hoá và giải mã của thuật toán G.729A giông với G.729. Các thủ tục lượng tử hoá và phân tích LP của các độ khuyếch đại bảng mã cố định và thích ứng giống như G.729. Các thay đổi thuật toán chính so với G.729 sẽ tổng kết như sau:
Bộ lọc trọng số thụ cảm sử dụng các tham số bộ lọc LP đã lượng tử và được biểu diễn là W(z) = A(z)/A(z/) với giá trị cố định = 0,75.
Phân tích độ lên giọng mạch vòng hở được đơn giản hoá bằng cách sử dụng phương pháp decimation (có nghĩa là trích 10 lấy 1) trong khi tính sự tương quan của tiếng nói trọng số.
Các tính toán phản ứng xung của bộ lọc tổng hợp trọng số W(z)/A(z) của tín hiệu ban đầu và việc thiết lập trạng thái ban đầu của bộ lọc được đơn giản hoá bằng cách thay thế W(z) bằng 1/A(z/).
Việc tìm bảng mã thích ứng được đơn giản hoá. Thay vì tìm tập trung ở mạch vòng tổ ong, giải pháp tìm sơ đồ hình cây độ sâu trước được sử dụng.
Tại bộ giải mã, hoạ ba của bộ lọc sau sẽ được đơn giản bằng cách sử dụng chỉ các độ trễ nguyên.
Cả hai bộ mã hoá G.729 và G.729A đã được thử nghiệm trên vi mạch T1 TMS320C50 DSP. Trong khi thử nghiêm USH, thuật toán mã hóa song công G.729A yêu cầu 12,4 MIPS, trong khi G.729 yêu cầu 22,3 MIPS. Sử dụng G.729A giảm được khoảng 50% độ phức tạp so với sử dụng G.729 với việc giảm một ít chất lượng trong trường hợp 3 bộ đôi ( mã hóa/giải mã) và trong trường hợp có tạp âm nền.
Chuẩn nén G.729B: G.729B đưa ra một nguyên lý nén im lặng tốc độ bit thấp được thiết kế và tối ưu hoá để làm việc trung được với cả G.729 và g.729A phức tạp thấp. Để đạt được việc nén im lặng tốc độ bit thấp chất lượng tốt, một mô đun bộ dò hoạt động thoại khung cơ bản là yếu tố cần thiết để dò các khung thoại không tích cực, gọi là các khung tạp âm nền hoặc khung im lặng. Đối với các khung thoại không tích cực đã dò được này, một mô đun truyền gián đoạn đo sự thay đổi theo thời gian của đặc tính tín hiệu thoại không tích cực và quyết định xem có một khung mô tả thông tin im lặng mới không có thể được gửi đi để duy trì chất lượng tái tạo của tạp âm nền tại đầu cuối thu. Nếu có một khung như thế được yêu cầu, các tham số năng lượng và phổ mô tả các đặc tính cảm nhận được của tạp âm nền được mã hoá và truyền đi một cách hiệu quả dùng khung 15 b/khung. Tại đầu cuối thu, môđun tạo ra âm phù hợp sẽ tạo tạp âm nền đầu ra sử dụng tham số cập nhật đã phát hoặc các tham số đã có trước đó. Tạp âm nền tổng hợp đạt được bằng cách lọc dự báo tuyến tính tín hiệu kích thích giả trắng được tạo ra trong nội bộ của mức điều khiển. Phương pháp mã hoá tạp âm nền tiết kiệm tốc độ bit cho tiếng nói mã hoá tại tốc độ bit trung bình thấp 4kbps trong cuộc đàm thoại tiếng nói bình thường để duy trì chất lượng tái tạo.
Đối với các ứng dụng DSVD (Digital Simultaneous Voice and Data: thoại và số liệu đồng thời số hoá) và độ nhạy tốc độ bit khác, G729B là điều kiện tối cần thiết để giảm tốc độ bit hơn nữa bằng cách sử dụng công nghệ nén im lặng. Khi không có tiếng nói, tốc độ bit có thể giảm, giải phóng dung lượng kênh cho các ứng dụng xảy ra đồng thời, ví dụ như các đường truyền tiếng khác trong điện thoại tế bào đa truy nhập phân kênh theo mã/ theo thời gian (TDMA/CDMA) hoặc truyền số liệu đồng thời. Một phần đáng kể trong các cuộc đàm thoại thông thường là im lặng, trung bình lên tới 60% của một cuộc đàm thoại hai chiều. Trong suốt quá trình im lặng, thiết bị đầu vào tiếng ví dụ như tai nghe, sẽ thu thông tin từ môi trường ồn. Mức và đặc tính ồn có thể thay đổi đáng kể, từ một phòng im lặng tới đường phố ồn ào hoặc từ một chiếc xe ô tô chuyển bánh nhanh. Tuy nhiên, hầu hết các nguồn tạp âm thường mang ít thông tin hơn thông tin tiếng. Vì vậy trong các chu kỳ không tích cực tỷ số nén sẽ cao hơn. Nhiều ứng dụng điển hình, ví dụ hệ thống toàn cầu đối với điện thoại di động GSM, sử dụng việc dò tìm chu kỳ im lặng và chèn tạp âm phù hợp để tạo được hiệu quả mã hoá cao hơn.
Xuất phát từ quan niệm về dò tìm im lặng và chèn tạp âm phù hợp dẫn tới các công nghệ mã hoá tiếng mẫu kép. Các mẫu khác nhau bởi tín hiệu đầu vào, được biểu thị là: thoại tích cực đối với tiếng nói và là thoại không tích cực đối với im lặng hoặc tạp âm nền, được xác định bởi sự phân loại tín hiệu. Sự phân loại này có thể được thực hiện bên trong hoặc bên ngoài bộ mã hoá tiếng nói. Bộ mã hoá tiếng toàn tốc có thể có tác dụng trong quá trình tiếng thoại tích cực, nhưng có một nguyên lý mã hoá khác được dùng đối với tín hiệu thoại không tích cực, sử dụng bit ít hơn và tạo ra tỷ số nén trung bình cao hơn. Sự phân loại này được gọi chung là bộ dò hoạt động thoại (VAD: Voice Activity Detector) và đầu ra của bộ này gọi là mức hoạt động thoại. Mức hoạt động thoại là 1 khi có mặt hoạt động thoại và là 0 khi không có hoạt động thoại.
Thuật toán VAD và bộ mã hoá tiếng nói không tích cực, giống với các bộ mã hoá G.729 và G.729A, được thực hiện trên các khung của tiếng nói đã được số hoá. Để phù hợp, kích thước các khung giống nhau được dùng cho mọi sơ đồ và không có độ trễ thêm vào nào được tạo ra bởi thuật toán VAD hoặc bộ mã hoá thoại không tích cực. Đầu vào bộ mã hoá tiếng nói là tín hiệu tiếng nói đến đã được số hoá. Với mỗi khung tiếng nói đầu vào, VAD đưa ra mức hoạt động thoại, mức này được dùng như một chuyển mạch giữa các bộ mã hoá thoại tích cực và thoại không tích cực. Khi bộ mã hoá thoại tích cực có tác dụng, luồng bit thoại tích cực sẽ gửi tới bộ giải mã tích cực cho mỗi khung. Tuy nhiên, trong các chu kỳ không tích cực, bộ mã hoá thoại không tích cực có thể được chọn để gửi các thông tin mới nhất gọi là bộ mô tả việc chèn im lặng (SID: Silence Insertion Descriptor) tới bộ giải mã không tích cực hoặc không gửi gì cả. Kỹ thuật này có tên là truyền gián đoạn (DTX: Discontinuous Transmission). Với mỗi khung, đầu ra của mỗi bộ giải mã được dùng làm tín hiệu khôi phục.
Chuẩn nén G.723.1: Khuyến nghị G.723.1 đưa ra một bộ mã hoá tiêu chuẩn dùng để nén tín hiệu tiếng nói hoặc các tín hiệu audio khác của các dịch vụ đa phương tiện tại tốc độ rất thấp, giống với phần tiêu chuẩn của họ H.323.
Về tốc độ bit: Bộ mã hoá này có hai tốc độ bit: 5,3 kbps và 6,3 kbps. Bộ mã hoá có tốc độ cao hơn sẽ có chất lượng tốt và, cộng thêm tính linh hoạt, cung cấp cho các nhà thiết kế hệ thống. Bộ mã hóa và giải mã bắt buộc phải có cả hai tốc độ bit này. Chúng có thể chuyển mạch được giữa hai tốc độ bit tại bất kỳ đường biên giới nào đó của khung. Khi tín hiệu là phi thoại thì có thể lựa chọn một tốc độ bit biến thiên để truyền không liên tục và điều khiển những khoảng trống.
Tín hiệu đầu vào có thể có của bộ mã hoá này tối ưu hoá tín hiệu tiếng nói với chất lượng cao tại các tốc độ bit đã nói ở trên với một độ hạn chế về độ phức tạp. Bộ mã hoá này dùng để mã hoá tiếng nói và các tín hiệu audio khác với các khung dùng kỹ thuật mã hoá phân tích bằng tổng hợp dự báo tuyến tính. Tín hiệu kích thích, đối với bộ mã hoá tốc độ bit cao hơn, là lượng tử hoá đúng cực đại đa xung (MP-MLQ: Multipulse Maximum Likelihood Quantilization) và đối với bộ mã hoá có tốc độ bit thấp hơn, là dự đoán tuyến tính kích thích mã đại số (ACELP). Kích thích khung là 30ms, cộng thêm 7,5ms look-ahead, tạo ra trễ xử lý thuật toán tổng cộng là 37,5ms. Toàn bộ trễ thêm vào bộ mã hoá là tổng của: Trễ xử lý, trễ truyền dẫn trên các đường truyền thông tin và trễ đệm của các giao thức ghép kênh.
Nguyên lý bộ mã hoá G.723.1: Tín hiệu PCM 64kbps đầu vào (theo luật A hoặc μ) qua bộ mã hoá này được lấy mẫu tại tần số 8kHz, sau đó qua bộ chuyển đổi thành tín hiệu PCM đều 16 bit đưa tới đầu vào bộ mã hoá. Tín hiệu đầu ra bộ giải mã sẽ được chuyển đổi thành tín hiệu PCM theo đúng tín hiệu đầu vào. Các đặc tính đầu vào/ đầu ra khác, giống như của tín hiệu PCM 64kbps (theo khuyến nghị ITU G.711), sẽ được chuyển đổi thành tín hiệu PCM đều 16 bit tại đầu vào bộ mã hoá, hoặc tín hiệu PCM đều 16 bit sẽ được chuyển đổi thành tín hiệu ra PCM theo đúng quy luật của tín hiệu đầu vào ở bộ giải mã. Bộ mã hoá dựa trên nguyên lý bộ mã hoá phân tích bằng tổng hợp dự báo tuyến tính và cố gắng cực tiểu hóa sai số có tính trọng số thụ cảm. Bộ mã hoá thực hiện theo từng khung 240 mẫu. Điều này tương đương với chu kỳ khung là 30ms và tần số lấy mẫu là 8kHz. Tại mỗi khối, đầu tiên tín hiệu được đưa qua bộ lọc thông cao để loại bỏ thành phần tín hiệu một chiều DC và sau đó được chia thành 4 khung con. Với mỗi khung con sử dụng tín hiệu đầu vào chưa xử lý để tính toán bộ lọc mã hoá dự báo tuyến tính bậc 10 (LPC). Bộ lọc LPC của khung con cuối cùng sẽ được lượng tử hoá bằng phương pháp lượng tử hoá vectơ phân chia dự báo (PSVQ: Predictive Split Vector Quantizer). Các hệ số LPC chưa được lượng tử sẽ được dùng để khôi phục bộ lọc trọng số thụ cảm ngắn hạn.
Với mỗi hai phân khung (120) mẫu, sẽ sử dụng tín hiệu tiếng nói trọng số để tính toán chu kỳ lên giọng tiếng nói mạch vòng kín, LOL. Chu kỳ lên giọng tiếng nói được tính trong khoảng từ 18 đến 142 mẫu.
Sau đó tín hiệu tiếng nói sẽ được xử lý theo từng phân khung cơ bản 60 mẫu.
Sử dụng đánh giá chu kỳ lên giọng tiếng nói trước để khôi phục bộ lọc dạng ồn sóng hài. Phản ứng xung được tạo bởi việc đấu nối bộ lọc tổng hợp LPC, bộ lọc có tính trọng số thụ cảm formant và bộ lọc dạng tạp âm sóng hài. Người ta sử dụng phản ứng xung này cho các phép tính toán tiếp sau.
Bộ dự đoán chu kỳ lên giọng mạch vòng kín được tính toán bằng cách sử dụng đánh giá chu kỳ lên giọng, LOL, và phản ứng xung. Người ta xử dụng bộ dự đoán lên giọng bậc 5. Chu kỳ lên giọng sẽ được tính là gần đúng giá trị vi sai nhỏ của đánh giá lên giọng mạch vòng hở. Thành phần thêm vào bộ dự đoán lên giọng sau đó sẽ được loại bỏ khỏi vectơ ban đầu. Cả hai giá trị chu kỳ lên giọng và giá trị vi sai của nó sẽ được truyền về phía bộ giải mã.
Cuối cùng, các thành phần không được dự đoán của tín hiệu kích thích sẽ được lấy gần đúng. Đối với bộ mã hoá có tốc độ bít cao, người ta sử dụng giá trị kích thích lượng tử hoá gần đúng cực đại đa xung (MP-MLQ), và đối với bộ mã hoá có tốc độ bit thấp, người ta sử dụng giá trị kích thích mã đại số (ACELP).
Nguyên lý bộ giải mã G.723.1: Bộ giải mã được thực hiện trên nguyên lý cơ bản từng khung. Đầu tiên các chỉ số của bộ lọc LPC sẽ được giải mã, sau đó bộ giải mã sẽ khôi phục bộ lọc tổng hợp LPC. Đối với mỗi phân khung, cả hai giá trị kích thích bản mã cố định và giá trị kích thích bảng mã thích ứng sẽ được giải mã và đưa tới đầu vào bộ lọc tổng hợp LPC. Bộ lọc sau thích ứng bao gôm formant và bộ lọc sau lên giọng phía sau-phía trước (forward-backward). Tín hiệu kích thích sẽ được đưa tới đầu vào bộ lọc sau lên giọng, đầu ra bộ lọc sau lên giọng được đưa tới đầu vào bộ lọc tổng hợp, và đầu ra bộ lọc tổng hợp sẽ được đưa tới đầu vào bộ lọc sau formant (formant posfilter).
Chuẩn nén GSM 06.10: Đầu vào bộ nén GSM 06.10 bao gồm các khung 160 mẫu các tín hiệu PCM tuyến tính lấy mẫu tại tần số 8kHz. Chu kỳ mỗi khung là 20 ms, khoảng một chu kỳ thanh môn đối với những người có giọng nói cực thấp, và khoảng mười chu kỳ thanh môn đối với những người có giọng nói cực cao. Đây là khoảng thời gian rất ngắn và trong khoảng này sóng tiếng nói thay đổi không nhiều lắm. Độ trễ truyền dẫn thông tin được tính bằng tổng thời gian xử lý và kích thước khung của thuật toán.
Bộ mã hoá thực hiện nén một khung tín hiệu đầu vào 160 mẫu (20ms) vào một khung 260 bit. Như vậy một giây nó sẽ thực hiện nén được 13.103 bit (tương đương với 1625 byte). Do vậy để nén một megabyte tín hiệu chỉ cần một thời gian chưa đầy 10 phút.
Trung tâm của quá trình xử lý tín hiệu là bộ lọc. Đầu ra bộ lọc phụ thuộc rất nhiều vào giá trị đầu vào đơn của nó. Khi có một dãy các giá trị đưa qua bộ lọc thì dãy tín hiệu này sẽ được dùng để kích thích bộ lọc. Dạng của bộ nén GSM 06.10 dùng để nén tín hiệu tiếng nói bao gồm hai bộ lọc và một giá trị kích thích ban đầu. Bộ lọc ngắn hạn dự báo tuyến tính, được đặt tại tầng đầu tiên của quá trình nén và tại tầng cuối cùng trong suốt quá trình giãn, được giả sử tuân theo quy luật âm thanh của mũi và cơ quan phát thanh. Nó được kích thích bởi đầu ra của bộ lọc dự báo dài hạn (LTP: long-term predictor).
Các cơ chế điều khiển chất lượng dịch vụ bên trong một phần tử mạng
Các thuật toán xếp hàng
Một cách để các phần tử mạng xử lý các dòng lưu lượng đến là sử dụng các thuật toán xếp hàng để sắp xếp các loại lưu lượng. Các thuật toán xếp hàng hay dùng là:
- Xếp hàng vào trước ra trước (FIFO Queuing).
- Xếp hàng theo mức ưu tiên (PQ - Priority Queuing).
- Xếp hàng tuỳ biến (CQ - Custom Queuing).
- Xếp hàng theo công bằng trọng số (WFQ - Weighted Fair Queuing).
FIFO Queuing
Trong dạng đơn giản nhất, thuật toán vào trước ra trước liên quan đến việc lưu trữ gói thông tin khi mạng bị tắc nghẽn và rồi chuyển tiếp các gói đi theo thứ tự mà chúng đến khi mạng không còn bị tắc nữa. FIFO trong một vài trường hơp là thuật toán mặc định vì tính đơn giản và không cần phải có sự thiết đặt cấu hình nhưng nó có một vài thiếu sot. Thiếu sót quan trọng nhất là FIFO không đưa ra sự quyết định nào về tính ưu tiên của các gói cũng như là không có sự bảo vệ mạng nào chống lại những ứng dụng (nguồn phát gói) có lỗi. Một nguồn phát gói lỗi phát quá ra một lưu lượng lớn đột ngột có thể là tăng độ trễ của các lưu lượng của các ứng dụng thời gian thực vốn nhạy cảm về thời gian. FIFO là thuật toán cần thiết cho việc điều khiển lưu lượng mạng trong giai đoạn ban đầu nhưng với những mạng thông minh hiện nay đòi hỏi phải có những thuật toán phức tạp hơn, đáp ứng được những yêu cầu khắt khe hơn.
PQ - Priority Queuing
Thuật toán PQ đảm bảo rằng những lưu lượng quan trọng sẽ có được sự xử lý nhanh hơn. Thuật toán được thiết kế để đưa ra tính ưu tiên nghiêm ngặt đối với những dòng lưu lượng quan trọng. PQ có thể thực hiện ưu tiên căn cứ vào giao thức, giao diện truyền tới, kích thước gói, địa chỉ nguồn hoặc điạ chỉ đích ...Trong thuật toán, các gói được đặt vào 1 trong các hàng đợi có mức ưu tiên khác nhau dựa trên các mức độ ưu tiên được gán (Ví dụ như bốn mức ưu tiên là High, Medium, Normal, và Low) và các gói trong hàng đợi có mức ưu tiêncao sẽ được xử lý để truyền đi trước. PQ được cấu hình dựa vào các số liệu thống kê về tình hình hoạt động của mạng và không tự động thích nghi khi điều kiện của mạng thay đổi.
Custom Queuing
CQ được tạo ra để cho phép các ứng dụng khác nhau cùng chia sẻ mạng với các yêu cầu tối thiểu về băng thông và độ trễ. Trong những môi trường này, băng thông phải được chia một cách tỉ lệ cho những ứng dụng và người sử dụng. CQ xử lý lưu lượng bằng cách gán cho mỗi loại gói thông tin trong mạng một số lượng cụ thể không gian hàng đợi và phục vụ các hàng đợi đó theo thuật toán round-robin (round-robin fashion). Cũng giống như PQ, CQ không tự thích ứng được khi điều kiện của mạng thay đổi.
WFQ - Weighted Fair Queuing
Trong trường hợp muốn có một mạng cung cấp được thời gian đáp ứng không đổi trong những điều kiện lưu lượng trên mạng thay đổi thì giải pháp là thuật toán WFQ. Thuật toán WFQ tương tự như CQ nhưng các giá trị sử dụng băng thông gán cho các loại gói không được gán một các cố định bởi người sử dụng mà được hệ thống tự động điều chỉnh thông qua hệ thống báo hiệu QoS.
WFQ được thiết kế để giảm thiểu việc thiết đặt cấu hình hàng đợi và tự động thích ứng với sự thay đổi điều kiện lưu lượng của mạng. Thuật toán này phù hợp với hầu hết các ứng dụng chạy trên những đường truyền không quá 2Mbps.
Định hình lưu lượng
Định hình lưu lượng cung cấp một cơ chế điều khiển lưu lượng tại một giao diện cụ thể. Nó giảm lưu lượng thông tin đi ra khỏi giao diện để tránh làm mạng bị tắc nghẽn bằng các buộc tốc độ thông tin đi ra ở một tốc độ bít cụ thể đối với trường hợp lưu lượng tăng đột ngột. Nguyên tắc định hình lưu lượng là phân loại gói thông tin để cho truyền qua hoặc loại bỏ.
Các cơ chế tăng hiệu quả đường truyền
Phân mảnh và truyền đan xen LFI
Các gói thông tin của các dịch vụ khác nhau có kích thước khác nhau. Ví dụ như gói thông tin của dong lưu lượng tương tác (telnet) hay của thoại có kích thước nhỏ trong khi đó gói thông tin của dịch vụ truyền file FTP (File Transfer Protocol) lại có kích thước lớn. Các gói kích thước lớn có độ trễ cao sẽ làm tăng độ trễ của các dòng thông tin cần độ trễ thấp. Cơ chế LFI cung cấp một cơ chế để giảm độ trễ của và jitter của các đường truyền tốc độ thấp bằng cách chia nhỏ các gói tin lớn của các lưu lượng có độ trễ cao và xen vào những gói tin nhỏ của các lưu lượng cần độ trễ thấp.
Nén tiêu đề các gói thoại
Các gói thoại sử dụng giao thức RTP để đóng gói tín hiệu audio để truyền đi trong mạng gói. Nén tiêu đề gói thoại giúp tăng hiệu quả của các lưu lượng thoại trong mạng IP.
Báo hiệu phục vụ điều khiển chất lượng dịch vụ
Báo hiệu điều khiển QoS là một phần của truyền thông trong mạng. Nó cung cấp một cách để một trạm cuối hay một phần tử mạng có thể đưa ra những yêu cầu đối với và phần tử khác. Báo hiệu QoS là rất cần thiết cho việc sử dụng các cơ chế xử lý lưu lượng như đã nêu ở trên.
Hai phương pháp hay dùng cho báo hiệu QoS là:
Chức năng mức ưu tiên IP (IP Precendence) của giao thức IP.
Sử dụng giao thức báo hiệu QoS RSVP (Resource Reservation Protocol)
Hiện nay, ITU đang phát triển thủ tục báo hiệu RSVP cho phép tăng cường khả năng của Internet trong việc điểu khiển các ứng dụng thời gian thực. Giao thức dự trữ tài nguyên này sẽ được cài trong các bộ chuyển mạch IP, các bộ định tuyến và kết hợp với khả năng của ATM trong cung cấp QoS để thiết lập và đảm bảo yêu cầu QoS cho các ứng dụng thời gian thực