Tựa gốc: Edge Computing: Vision and Challenges
Tác giả gốc: Giáo sư Shi Weisong
Làn sóng số hóa toàn cầu hiện nay đang bùng nổ. Điện toán cạnh cung cấp các khả năng chính như điện toán, mạng và trí thông minh lân cận, đẩy nhanh quá trình chuyển đổi và nâng cấp của nền kinh tế trao quyền, và dần trở thành một hướng mới của hệ thống máy tính, một định dạng mới trong lĩnh vực thông tin và một nền tảng mới để chuyển đổi công nghiệp đang trong giai đoạn phát triển nhanh chóng. Việc phổ biến khái niệm điện toán cạnh đang tăng tốc hướng tới triển khai thực tế, điều này đã thu hút sự chú ý rộng rãi từ giới học thuật và ngành công nghiệp.
Điện toán biên ủng hộ việc xử lý dữ liệu ở biên mạng, do đó giảm thời gian phản hồi của hệ thống, bảo vệ quyền riêng tư và bảo mật dữ liệu, kéo dài tuổi thọ pin và tiết kiệm băng thông mạng.
tiêu đề phụ
01 Điện toán cạnh là gì
Khi lượng dữ liệu được tạo ở rìa mạng tiếp tục tăng, việc xử lý dữ liệu trực tiếp ở rìa mạng sẽ hiệu quả hơn. Trung tâm dữ liệu vi mô, đám mây vi mô và điện toán sương mù đã được đề xuất trước đây. Trong phần này, chúng tôi sẽ giải thích điện toán biên là gì và tại sao điện toán biên lại hiệu quả hơn điện toán đám mây đối với một số dịch vụ điện toán nhất định.
Đưa mọi tác vụ tính toán lên đám mây là một cách hiệu quả, bởi sức mạnh tính toán của đám mây mạnh hơn nhiều so với thiết bị biên. Mặc dù tốc độ xử lý dữ liệu nhanh nhưng băng thông mạng rất hạn chế. Khi dữ liệu tiếp tục tăng lên, tốc độ truyền dữ liệu đã trở thành một nút thắt cổ chai để cải thiện khả năng điện toán đám mây. Ví dụ: một chiếc máy bay Boeing 787 tạo ra dữ liệu 5G mỗi giây, nhưng băng thông giữa máy bay và vệ tinh hoặc trạm gốc không thể đáp ứng lượng truyền dữ liệu lớn như vậy. Ô tô tự lái có thể tạo ra 1G dữ liệu mỗi giây và nó cần xử lý dữ liệu theo thời gian thực và thực hiện các hành động chính xác. Nếu tất cả dữ liệu được gửi lên đám mây để xử lý, thời gian phản hồi sẽ trở nên rất lâu và việc hỗ trợ nhiều ô tô trong một khu vực nhất định hoạt động cùng lúc cũng là một thách thức lớn đối với băng thông và độ tin cậy của mạng hiện tại. Do đó, điều này yêu cầu xử lý dữ liệu trực tiếp trên các thiết bị biên mạng.
Hầu như tất cả các thiết bị điện tử sẽ là một phần của Internet vạn vật và chúng sẽ đóng vai trò là nhà sản xuất và người tiêu dùng dữ liệu, chẳng hạn như cảm biến chất lượng không khí, đèn đường, lò vi sóng, v.v. Có rất nhiều thiết bị trong số này tạo ra lượng dữ liệu khổng lồ, vì vậy các phương pháp điện toán đám mây truyền thống sẽ không thể hỗ trợ lượng dữ liệu khổng lồ như vậy. Do đó, lượng lớn dữ liệu do các thiết bị IoT tạo ra không thể được truyền hết lên đám mây và chúng cần được xử lý trực tiếp ở rìa mạng.
Sơ đồ trên cho thấy cấu trúc của điện toán đám mây truyền thống. Nhà sản xuất dữ liệu tạo dữ liệu thô và gửi dữ liệu đó lên đám mây, còn người tiêu dùng dữ liệu gửi yêu cầu lên đám mây và sử dụng dữ liệu. Nhưng cấu trúc này không thể đáp ứng nhu cầu của thời đại Internet of Things. Đầu tiên, lượng dữ liệu do thiết bị tạo ra quá lớn, dẫn đến tiêu tốn nhiều băng thông và tài nguyên không cần thiết. Thứ hai, nhu cầu bảo vệ quyền riêng tư cũng cản trở việc áp dụng điện toán đám mây. Thứ ba, hầu hết các nút cuối IoT là thiết bị có năng lượng hạn chế, có thể chạy bằng pin và các mô-đun giao tiếp không dây thường tương đối tiêu tốn năng lượng, do đó, rất hiệu quả khi trực tiếp thực hiện một số tác vụ điện toán trên các nút biên.
Trong mô hình điện toán đám mây, các thiết bị đầu cuối ở rìa thường đóng vai trò là người tiêu dùng dữ liệu, chẳng hạn như xem video YouTube trên điện thoại thông minh. Nhưng giờ đây con người cũng đóng vai trò là nhà sản xuất dữ liệu, sử dụng điện thoại thông minh để chụp ảnh, quay video rồi chia sẻ lên YouTube, Facebook, Twitter, v.v. Tuy nhiên, khối lượng dữ liệu của những hình ảnh và video này quá lớn và nếu chúng được tải trực tiếp lên Internet, nó sẽ chiếm rất nhiều băng thông. Do đó, hình ảnh và video có thể được điều chỉnh trực tiếp trên thiết bị đầu cuối, sau đó được tải lên đám mây. Một ví dụ khác là các thiết bị y tế có thể đeo được. Dữ liệu do các thiết bị này thu thập có thể tương đối riêng tư, do đó, việc xử lý dữ liệu trực tiếp trên thiết bị thay vì tải lên đám mây sẽ bảo vệ quyền riêng tư của dữ liệu tốt hơn.
Điện toán biên là một công nghệ cho phép có thể tính toán dữ liệu đường lên cho các dịch vụ IoT và dữ liệu đường xuống cho các dịch vụ đám mây ở biên mạng. "Cạnh" ở đây đề cập đến bất kỳ tài nguyên mạng và điện toán nào giữa nguồn dữ liệu và trung tâm dữ liệu đám mây. Ví dụ: điện thoại thông minh là "ranh giới" giữa các cá nhân và đám mây và một cổng trong ngôi nhà thông minh là "ranh giới" giữa các thiết bị gia đình và đám mây. Nguyên tắc cơ bản của điện toán cạnh là thực hiện các phép tính gần với nguồn dữ liệu. Từ quan điểm này, điện toán biên tương tự như điện toán sương mù, nhưng điện toán biên tập trung nhiều hơn vào khía cạnh "thứ", trong khi điện toán sương mù tập trung nhiều hơn vào cơ sở hạ tầng. Chúng tôi nghĩ rằng điện toán biên sẽ có tác động lớn đến xã hội của chúng ta như điện toán đám mây.
Hình 2 cho thấy luồng điện toán hai chiều trong điện toán biên. Trong mô hình điện toán biên, mọi thứ không chỉ là người tiêu dùng dữ liệu mà còn là nhà sản xuất dữ liệu. Ở rìa mạng, mọi thứ không chỉ có thể yêu cầu dịch vụ và nội dung từ đám mây mà còn thực hiện các tác vụ điện toán. Edge có thể lưu trữ, lưu trữ và xử lý dữ liệu trong khi gửi các yêu cầu và dịch vụ đám mây cho người dùng. Do đó, cần phải thiết kế đúng ranh giới của mạng để đáp ứng các yêu cầu về bảo mật, độ tin cậy và bảo vệ quyền riêng tư.
tiêu đề phụ
02Các trường hợp liên quan
Trong mô hình điện toán đám mây, nơi hầu hết tính toán xảy ra trên đám mây, mô hình điện toán này có thể dẫn đến sự chậm trễ hệ thống kéo dài làm giảm trải nghiệm người dùng. Trong điện toán cạnh, cạnh có một số tài nguyên điện toán nhất định, có thể giúp đám mây chia sẻ một phần tác vụ điện toán.
Trong mạng phân phối nội dung truyền thống (CDN), chỉ dữ liệu được lưu vào bộ đệm trên các máy chủ biên. Bởi vì trong vài thập kỷ qua, các nhà cung cấp nội dung đã cung cấp dữ liệu trực tiếp trên Internet. Nhưng trong kỷ nguyên IoT, dữ liệu được sản xuất và tiêu thụ ở rìa. Do đó, trong điện toán biên, dữ liệu và các thao tác trên dữ liệu cần được lưu vào bộ đệm trên biên.
Một lợi thế của điện toán cạnh có thể được nhìn thấy trong các dịch vụ mua sắm trực tuyến. Người tiêu dùng có thể thường xuyên vận hành giỏ hàng, theo mặc định, các thao tác trên giỏ hàng sẽ được hoàn thành trên đám mây, sau đó giao diện giỏ hàng phía khách hàng sẽ được cập nhật. Tùy thuộc vào tốc độ internet và tải của máy chủ, quá trình này có thể mất nhiều thời gian và thậm chí lâu hơn đối với thiết bị di động. Khi ngày càng có nhiều hoạt động mua sắm được thực hiện trên các máy khách di động, để cải thiện trải nghiệm người dùng, hoạt động cập nhật giỏ hàng có thể được chuyển sang các nút biên. Như đã đề cập trước đó, dữ liệu giỏ hàng của người dùng và hoạt động trên giỏ hàng có thể được lưu vào bộ đệm tại các nút biên. Tất nhiên, dữ liệu giỏ hàng của người dùng cuối cùng sẽ được đồng bộ hóa với đám mây, nhưng chúng có thể chạy trong nền.
Khi người dùng di chuyển từ nút cạnh này sang nút cạnh khác, điều này liên quan đến sự cộng tác giữa nhiều nút. Chúng ta có thể chỉ cần lưu trữ dữ liệu vào từng nút cạnh mà người dùng truy cập, nhưng việc đồng bộ hóa của từng nút cần được nghiên cứu thêm. Ví dụ: các ứng dụng điều hướng trong một khu vực nhỏ có thể di chuyển các dịch vụ điều hướng hoặc tìm kiếm đến biên; lọc nội dung và tích hợp có thể được thực hiện trên các nút biên để giảm lượng truyền dữ liệu; các ứng dụng thời gian thực như AR có thể sử dụng các nút biên để giảm thời gian đáp ứng. Do đó, sử dụng điện toán biên có thể giảm độ trễ của hệ thống và cải thiện đáng kể trải nghiệm người dùng.
Sự phổ biến của điện thoại di động và webcam đã làm cho phân tích video trở thành một công nghệ mới nổi. Điện toán đám mây không phù hợp để phân tích video vì độ trễ lâu trong quá trình truyền dữ liệu và các lo ngại về quyền riêng tư. Ở đây chúng tôi đề cập đến một ví dụ về tìm kiếm trẻ em mất tích. Bây giờ trong thành phố có rất nhiều camera, khi một đứa trẻ bị lạc, rất có thể nó sẽ bị camera bắt được. Tuy nhiên, do các vấn đề về quyền riêng tư và chi phí truyền dẫn, những dữ liệu camera này thường không được truyền lên đám mây, vì vậy chúng tôi khó sử dụng nhiều loại camera như vậy.
Ngay cả khi có quyền truy cập vào dữ liệu này từ đám mây, việc chuyển và tìm kiếm một lượng lớn dữ liệu như vậy có thể tốn thời gian, điều này có thể khiến trẻ em mất tích không thể chịu đựng được. Chúng ta có thể tận dụng mô hình điện toán biên để gửi các yêu cầu tìm kiếm trẻ em bị mất tích từ đám mây đến các thiết bị trong khu vực mục tiêu. Mỗi thiết bị trong một khu vực cụ thể, chẳng hạn như điện thoại thông minh, sẽ tìm kiếm trong dữ liệu máy ảnh cục bộ và sau đó chỉ trả về kết quả tìm kiếm, do đó thời gian tìm kiếm sẽ giảm đi rất nhiều.
Internet of Things đã cải thiện đáng kể môi trường gia đình. Một số sản phẩm liên quan đã xuất hiện trên thị trường, chẳng hạn như đèn thông minh, TV thông minh, robot quét rác, v.v. Nhưng chỉ kết nối các thiết bị với đám mây thông qua các mô-đun giao tiếp không dây như Wi-Fi thì còn lâu mới trở thành một ngôi nhà thông minh. Trong một ngôi nhà thông minh, ngoài các thiết bị được kết nối, một số lượng lớn cảm biến và bộ điều khiển nên được triển khai trong các phòng, đường ống, sàn nhà, tường, v.v. Chúng sẽ tạo ra một lượng lớn dữ liệu, nhưng xem xét các vấn đề về quyền riêng tư và áp lực truyền dẫn, hầu hết các dữ liệu này cần được sử dụng trực tiếp tại địa phương. Điều này khiến điện toán đám mây không còn phù hợp với ngôi nhà thông minh và sẽ bị thay thế bởi điện toán biên. Bằng cách chạy hệ điều hành biên (EdgeOS) trên cổng nhà, các thiết bị trong nhà có thể kết nối với cổng, sau đó triển khai các dịch vụ liên quan để quản lý thống nhất.
Hình 3 cho thấy cấu trúc EdgeOS trong một ngôi nhà thông minh. EdgeOS có thể thu thập nhiều dữ liệu khác nhau trong nhà thông qua Wi-FI, Bluetooth, ZigBee, mạng di động, v.v. Các nguồn dữ liệu khác nhau sẽ được hợp nhất ở lớp trừu tượng hóa dữ liệu. Phía trên lớp trừu tượng hóa dữ liệu là lớp quản lý dịch vụ. Lớp này cần hỗ trợ Sự khác biệt, Khả năng mở rộng, Cách ly và Độ tin cậy.
Mô hình điện toán cạnh có thể được áp dụng trong nhà thông minh, cộng đồng và thậm chí ở các thành phố. Những lý do chính như sau:
1. Lượng dữ liệu lớn: Theo dữ liệu liên quan, một thành phố có dân số thường trú là một triệu người sẽ tạo ra 180PB dữ liệu mỗi ngày và những dữ liệu này đến từ an toàn công cộng, chăm sóc y tế, giao thông vận tải, v.v. Việc xây dựng một trung tâm dữ liệu đám mây tập trung để xử lý các dữ liệu này là không thực tế. Điện toán cạnh là một giải pháp hiệu quả.
2. Độ trễ thấp: Đối với những ứng dụng yêu cầu độ trễ thấp và xác định, chẳng hạn như thiết bị y tế hoặc thiết bị an toàn công cộng, điện toán cạnh cũng là một mô hình phù hợp, có thể tiết kiệm thời gian truyền và đơn giản hóa cấu trúc mạng. So với xử lý đám mây, xử lý dữ liệu ở biên sẽ giúp việc ra quyết định hiệu quả hơn.
3. Nhận biết vị trí: Đối với các ứng dụng dựa trên vị trí địa lý như quản lý phương tiện giao thông, điện toán biên có thể thu được thông tin vị trí chính xác hơn. Dữ liệu có thể được thu thập và xử lý dựa trên vị trí mà không cần gửi lên đám mây.
Trong công nghiệp và học thuật, đám mây có thể nói là nền tảng điện toán tiêu chuẩn để xử lý dữ liệu lớn. Điện toán đám mây yêu cầu dữ liệu phải được chuyển lên đám mây để xử lý, nhưng trong nhiều trường hợp, rất ít bên liên quan sở hữu dữ liệu sẵn sàng chia sẻ dữ liệu đó do lo ngại về quyền riêng tư và chi phí truyền dữ liệu, vì vậy cơ hội cộng tác cho nhiều bên liên quan bị hạn chế. Cạnh, với tư cách là một trung tâm dữ liệu nhỏ, kết nối đám mây và người dùng cuối. Một cạnh hợp tác kết nối một số cạnh khác nhau. Kết nối giống như Ngôi nhà này cho phép các bên liên quan khác nhau cộng tác và chia sẻ dữ liệu.
Một ứng dụng rất có giá trị trong tương lai gần là các ứng dụng chăm sóc sức khỏe được kết nối, như trong Hình 4. Chẳng hạn, nếu có dịch cúm bùng phát, bệnh nhân đổ đến bệnh viện, hồ sơ bệnh án điện tử của bệnh nhân sẽ được cập nhật cùng lúc. Các bệnh viện đếm và chia sẻ thông tin về các đợt bùng phát dịch cúm, chẳng hạn như chi phí điều trị trung bình, các triệu chứng, số người bị bệnh, v.v. Về mặt lý thuyết, bệnh nhân sẽ đến nhà thuốc lấy thuốc theo đơn, nhưng cũng có thể bệnh nhân không tuân theo lời khuyên của bác sĩ để điều trị, nhưng bệnh viện không biết rằng bệnh nhân đã không uống thuốc, nên bệnh viện phải chịu trách nhiệm rút lui. Giờ đây, thông qua Collaborative Edge, các hiệu thuốc có thể cung cấp cho bệnh viện hồ sơ mua hàng của bệnh nhân, mang lại sự rõ ràng cho trách nhiệm y tế.
Đồng thời, nhà thuốc sử dụng lợi thế hợp tác để có được số lượng bệnh nhân từ bệnh viện, để nhà thuốc có thể dự trữ trước và do đó thu được nhiều lợi nhuận hơn. Ngoài ra, nhà thuốc cũng có thể lấy giá, địa điểm và số lượng thuốc tồn kho từ công ty dược phẩm. Nhà thuốc cũng có thể lấy giá giao hàng của công ty hậu cần để xây dựng kế hoạch dùng thuốc phù hợp hơn. Các công ty dược phẩm có thể xây dựng kế hoạch sản xuất hợp lý dựa trên dữ liệu thuốc được gửi bởi các hiệu thuốc. Đồng thời, Trung tâm kiểm soát và phòng ngừa dịch bệnh của chính phủ cũng có thể đưa ra cảnh báo cho người dân ở một khu vực cụ thể bằng cách phát hiện số người mắc bệnh và thực hiện các biện pháp tương ứng để hạn chế sự lây lan của bệnh cúm.
tiêu đề phụ
03 Cơ hội và thách thức
Trong phần trước, chúng tôi đã giới thiệu một số ví dụ ứng dụng của điện toán cạnh. Trong phần này, chúng tôi tóm tắt những thách thức của điện toán biên và đề xuất một số giải pháp đáng để nghiên cứu thêm. Chủ yếu liên quan đến khả năng lập trình, đặt tên, trừu tượng hóa dữ liệu, quản lý dịch vụ, quyền riêng tư và bảo mật cũng như các chỉ số tối ưu hóa.
1. Khả năng lập trình
Trong điện toán đám mây, người dùng viết chương trình và triển khai chúng trên đám mây. Các nhà cung cấp đám mây chịu trách nhiệm quyết định nơi thực hiện các tác vụ điện toán. Người dùng không biết ứng dụng chạy như thế nào, đây cũng là một lợi thế của điện toán đám mây và cấu trúc cơ sở hạ tầng của điện toán đám mây là minh bạch đối với người dùng. Thông thường, vì chương trình chỉ chạy trên đám mây nên nó được hoàn thành bởi một ngôn ngữ lập trình và được biên dịch sang một nền tảng đích cụ thể để chạy. Nhưng trong điện toán biên, các tác vụ điện toán được phân phối tới các nút biên trên nhiều nền tảng khác nhau. Thời gian chạy của các nút khác nhau là khác nhau và các nhà phát triển chương trình phải đối mặt với những khó khăn lớn.
Để giải quyết vấn đề về khả năng lập trình của điện toán biên, chúng tôi đề xuất khái niệm luồng tính toán. Nó đề cập đến một loạt các hoạt động trên dữ liệu trên đường truyền dữ liệu. Những hành động này có thể bao gồm tất cả hoặc một phần chức năng của ứng dụng. Luồng điện toán là một quy trình điện toán do phần mềm xác định, có thể xử lý dữ liệu theo cách phân tán và hiệu quả trên các thiết bị tạo dữ liệu, nút biên và môi trường đám mây.
Khi điện toán biên được xác định, điện toán nên được thực hiện ở biên thay vì trên đám mây. Trong trường hợp này, luồng tính toán có thể giúp người dùng quyết định thao tác nào cần được thực hiện và cách truyền dữ liệu. Các số liệu về nơi thực hiện các hoạt động có thể là độ trễ, mức tiêu thụ năng lượng, các hạn chế về phần cứng và phần mềm, v.v. Bằng cách triển khai các luồng điện toán, chúng tôi tin rằng điện toán dữ liệu phải càng gần nguồn dữ liệu càng tốt, do đó giảm chi phí truyền dữ liệu. Trong luồng tính toán, các hoạt động có thể được phân phối lại và dữ liệu và trạng thái tương ứng phải được phân phối lại. Ngoài ra, chúng tôi phải giải quyết các vấn đề cộng tác, chẳng hạn như đồng bộ hóa dữ liệu.
2. Đặt tên
Trong điện toán ranh giới, một giả định quan trọng là khối lượng của mọi thứ là rất lớn. Có nhiều ứng dụng chạy trên các nút cạnh và mỗi ứng dụng có cấu trúc tổ chức dịch vụ riêng. Giống như tất cả các hệ thống máy tính, trong điện toán ranh giới, danh pháp rất quan trọng đối với việc lập trình, đánh địa chỉ, nhận dạng đối tượng và truyền dữ liệu. Tuy nhiên, ở giai đoạn này, một cơ chế đặt tên hiệu quả và chuẩn hóa vẫn chưa được xác định cho mô hình điện toán biên. Để giao tiếp với các hệ thống không đồng nhất khác nhau, các nhà phát triển biên cần học nhiều giao thức giao tiếp mạng khác nhau. Nguyên tắc đặt tên của điện toán biên cần giải quyết tính di động của các đối tượng, tính biến đổi cao của cấu trúc liên kết mạng, bảo vệ quyền riêng tư và bảo mật cũng như khả năng mở rộng cho một số lượng lớn các đối tượng không chắc chắn.
Các cơ chế đặt tên truyền thống như DNS và URI có thể đáp ứng hầu hết các yêu cầu mạng hiện tại. Nhưng chúng không đủ linh hoạt để phục vụ các mạng cạnh động. Bởi vì các thiết bị ở rìa có tính di động cao và có tài nguyên hạn chế. Đối với những thiết bị có tài nguyên hạn chế, nguyên tắc đặt tên dựa trên IP không thể được hỗ trợ.
Các cơ chế đặt tên mới như Mạng dữ liệu được đặt tên (NDN) và MobilityFirst có thể được áp dụng trong điện toán biên. NDN cung cấp cấu trúc đặt tên phân cấp, có khả năng mở rộng tốt, dễ đọc và tạo điều kiện thuận lợi cho việc quản lý dịch vụ. Tuy nhiên, để phù hợp với các giao thức truyền thông khác như Bluetooth, Zigbee, v.v., cần thêm các tác nhân phụ vào nó. Một vấn đề khác với NDN là bảo mật, vì rất khó để tách thông tin phần cứng của thiết bị khỏi nhà cung cấp dịch vụ. Để cung cấp hỗ trợ di động tốt hơn, MobilityFirst có thể tách tên khỏi địa chỉ mạng nhưng yêu cầu sử dụng mã định danh duy nhất toàn cầu (GUID). Một nhược điểm khác của MobilityFirst là nó không thuận tiện cho việc quản lý dịch vụ, vì GUID không dễ đọc.
Đối với một cạnh cố định tương đối nhỏ, chẳng hạn như môi trường gia đình, EdgeOS có thể gán địa chỉ mạng cho từng thiết bị. Trong một hệ thống, mỗi thiết bị có một tên duy nhất mà con người có thể đọc được, tên này mô tả các thông tin sau: vị trí, vai trò, mô tả dữ liệu. Ví dụ: "Bếp. Lò vi sóng. Nhiệt độ".
Như trong Hình 5, EdgeOS sẽ gán mã định danh và địa chỉ tương ứng cho nó. Mỗi đối tượng có một tên duy nhất mà con người có thể đọc được, giúp dễ dàng quản lý dịch vụ, nhận dạng đối tượng và thay thế các bộ phận. Cơ chế đặt tên này rất thuận tiện cho cả người dùng và nhà cung cấp dịch vụ. Chẳng hạn, người dùng sẽ nhận được thông tin từ EdgeOS như “đèn trên trần phòng ngủ bị hỏng”, để người dùng có thể trực tiếp thay thế bóng đèn mà không cần phải tìm mã lỗi hay cấu hình lại địa chỉ mạng cho bóng đèn. Cơ chế đặt tên này cung cấp cho các nhà cung cấp dịch vụ khả năng lập trình tốt hơn, che chắn thông tin phần cứng và bảo vệ quyền riêng tư và bảo mật dữ liệu tốt hơn. Các mã định danh và địa chỉ mạng duy nhất có thể được ánh xạ trực tiếp với các tên mà con người có thể đọc được. EdgeOS sử dụng mã định danh để quản lý đối tượng. Các địa chỉ mạng như địa chỉ IP hoặc địa chỉ MAC có thể được sử dụng để hỗ trợ các giao thức truyền thông khác nhau, chẳng hạn như Bluetooth, WIFI, Zigbee, v.v.
3. Trừu tượng hóa dữ liệu
Các ứng dụng khác nhau chạy trên EdgeOS và mỗi ứng dụng cung cấp các dịch vụ cụ thể thông qua API lớp quản lý dịch vụ. Vấn đề trừu tượng hóa dữ liệu đã được nghiên cứu chuyên sâu trong các mạng cảm biến không dây và mô hình điện toán đám mây. Nhưng trong điện toán cạnh, vấn đề này trở nên khó khăn hơn. Trong thời đại của Internet of Things, có một số lượng lớn các thiết bị tạo dữ liệu trong mạng. Ở đây chúng tôi lấy ví dụ về ngôi nhà thông minh, trong môi trường ngôi nhà thông minh, hầu hết tất cả các thiết bị sẽ gửi dữ liệu đến EdgeOS. Nhưng hầu hết các thiết bị ở rìa mạng chỉ định kỳ gửi dữ liệu đến cổng. Ví dụ: nhiệt kế gửi dữ liệu mỗi phút nhưng dữ liệu này chỉ được người dùng thực sử dụng một vài lần trong ngày. Một ví dụ khác là camera an ninh gia đình. Nó ghi lại dữ liệu và gửi nó đến cổng vào bất cứ lúc nào, nhưng dữ liệu này sẽ nằm trong cơ sở dữ liệu trong một thời gian, không được ai sử dụng và cuối cùng được thay thế bằng dữ liệu mới.
Dựa trên những điều trên, chúng tôi tin rằng nên giảm thiểu tối đa sự can thiệp của con người vào điện toán biên và các nút biên nên sử dụng/xử lý tất cả dữ liệu và tương tác với người dùng một cách chủ động. Trong trường hợp này, cổng cần xử lý trước dữ liệu, chẳng hạn như loại bỏ tiếng ồn, phát hiện sự kiện và bảo vệ quyền riêng tư. Dữ liệu được xử lý sẽ được gửi lên tầng trên để cung cấp các dịch vụ phù hợp. Quá trình này phải đối mặt với một số thách thức.
Đầu tiên, như trong Hình 6, các định dạng dữ liệu được truyền từ các thiết bị khác nhau là khác nhau. Xem xét các vấn đề về quyền riêng tư và bảo mật, ứng dụng trên cổng không nên lấy dữ liệu thô mà chỉ cần lấy nội dung quan tâm từ bảng dữ liệu đầy đủ. Định dạng của bảng dữ liệu có thể là ID, thời gian, tên, dữ liệu (chẳng hạn như 0000,12:34:56pm 01/01/2022, kitchen.oven2.Temperature3, 78). Tuy nhiên, dữ liệu cảm biến bị ẩn nên tính khả dụng của dữ liệu có thể bị ảnh hưởng. Thứ hai, đôi khi rất khó quyết định mức độ trừu tượng của dữ liệu. Một số ứng dụng hoặc dịch vụ có thể không nhận đủ thông tin nếu quá nhiều dữ liệu thô bị lọc ra. Nhưng lưu trữ dữ liệu cũng có thể cồng kềnh nếu bạn giữ quá nhiều dữ liệu thô. Đôi khi do độ chính xác của cảm biến thấp, môi trường không ổn định hoặc giao tiếp bất thường, thông tin dữ liệu trên thiết bị biên có thể không đáng tin cậy, vì vậy làm thế nào để trích xuất thông tin hữu ích từ dữ liệu không đáng tin cậy cũng là một thách thức.
Việc thu thập dữ liệu là dành cho các ứng dụng, để hoàn thành các dịch vụ cụ thể, các ứng dụng cần kiểm soát các đối tượng, chẳng hạn như đọc và ghi dữ liệu. Lớp trừu tượng hóa dữ liệu kết hợp các phương pháp trình bày dữ liệu và các thao tác tương ứng, đồng thời cung cấp một giao diện chung. Ngoài ra, do sự đa dạng của các thiết bị, phương pháp trình bày dữ liệu và các hoạt động tương ứng là khác nhau nên không dễ để tìm ra một phương pháp trừu tượng hóa dữ liệu chung.
4. Quản lý dịch vụ
Đối với việc quản lý dịch vụ ở rìa mạng, để đảm bảo tính ổn định của hệ thống, chúng tôi cho rằng nó cần phải có các đặc điểm sau: khả năng phân biệt, khả năng mở rộng, cách ly và độ tin cậy.
Tính khác biệt: Với sự phát triển nhanh chóng của IoT, nhiều dịch vụ sẽ được triển khai ở rìa mạng. Các dịch vụ khác nhau nên có các ưu tiên khác nhau và các dịch vụ chính như phán đoán đối tượng và cảnh báo lỗi nên được thực thi trước các dịch vụ thông thường khác. Đối với các dịch vụ liên quan đến sức khỏe, việc phát hiện nhịp tim phải được ưu tiên cao nhất.
Khả năng mở rộng: Khả năng mở rộng là một thách thức lớn đối với biên mạng. Các thiết bị trong IoT năng động hơn các hệ thống di động. Liệu thiết bị mới mà người dùng mua có thể được kết nối với hệ thống ban đầu hay không sẽ là một vấn đề cần giải quyết trước tiên. Những vấn đề này có thể được giải quyết bằng cách thiết kế một lớp quản lý dịch vụ linh hoạt và có thể mở rộng.
Cách ly: Cách ly là một vấn đề khác cần được giải quyết ở rìa mạng. Trên hệ thống di động, nếu ứng dụng gặp sự cố, toàn bộ hệ thống sẽ khởi động lại. Trong các hệ thống phân tán, các tài nguyên được chia sẻ có thể được quản lý thông qua các cơ chế đồng bộ hóa khác nhau như khóa hoặc vòng mã thông báo. Nhưng trong EdgeOS, vấn đề phức tạp hơn.
Nhiều ứng dụng sẽ chia sẻ cùng một tài nguyên, chẳng hạn như điều khiển đèn. Nếu ứng dụng gặp sự cố hoặc không phản hồi, người dùng vẫn có thể điều khiển đèn mà không làm hỏng toàn bộ EdgeOS. Sau khi người dùng xóa ứng dụng điều khiển đèn khỏi hệ thống, đèn vẫn cần duy trì kết nối với EdgeOS. Chúng ta có thể giải quyết vấn đề này bằng cách triển khai/không triển khai khung. Nếu phát hiện xung đột trước khi ứng dụng được cài đặt, một cảnh báo sẽ được gửi tới người dùng để tránh các sự cố truy cập tiềm ẩn. Một vấn đề khác là cách cô lập dữ liệu cá nhân của người dùng khỏi các ứng dụng của bên thứ ba. Ví dụ: ứng dụng theo dõi hoạt động của bạn không thể truy cập vào dữ liệu sử dụng pin của bạn. Để giải quyết vấn đề này, chúng ta có thể thêm cơ chế kiểm soát truy cập trong lớp quản lý dịch vụ của EdgeOS.
Độ tin cậy: Độ tin cậy cũng là một vấn đề quan trọng. Từ góc độ dịch vụ, đôi khi rất khó để xác định chính xác lý do tại sao một dịch vụ bị lỗi. Ví dụ: nếu máy điều hòa không khí bị hỏng, các nguyên nhân có thể bao gồm mất điện, hỏng máy nén hoặc thậm chí là hết pin bộ điều nhiệt. Các nút cảm biến có thể mất kết nối với hệ thống do hết pin, điều kiện kết nối kém hoặc các bộ phận bị mòn. Sẽ thật tuyệt nếu EdgeOS có thể cảnh báo cho người dùng phần nào không phản hồi hoặc cảnh báo trước cho người dùng phần nào của hệ thống có nguy cơ bị hỏng. Từ quan điểm hệ thống, việc duy trì loại cấu trúc liên kết mạng của toàn bộ hệ thống là rất quan trọng và mỗi thành phần trong hệ thống có thể gửi thông tin trạng thái/chẩn đoán tới EdgeOS. Điều này giúp dễ dàng triển khai các dịch vụ như phát hiện lỗi, thay thế thiết bị và kiểm tra chất lượng dữ liệu.
Từ quan điểm dữ liệu, những thách thức đối với độ tin cậy chủ yếu đến từ dữ liệu cảm biến và phần giao tiếp. Như đã nghiên cứu và thảo luận trước đây, cạnh mạng có thể bị lỗi vì nhiều lý do, gửi dữ liệu không đáng tin cậy. Chúng tôi cũng đã đề cập đến nhiều giao thức truyền thông mới để thu thập dữ liệu IoT, có thể hỗ trợ một số lượng lớn các nút cảm biến và các điều kiện mạng động. Nhưng độ tin cậy kết nối của chúng không tốt bằng Bluetooth hoặc WIFI. Việc cung cấp dịch vụ đáng tin cậy sẽ là một thách thức nếu dữ liệu và thông tin liên lạc không đáng tin cậy.
5. Quyền riêng tư và Bảo mật
Ở rìa mạng, bảo vệ quyền riêng tư và bảo mật dữ liệu là một dịch vụ quan trọng. Nếu các ứng dụng IoT được triển khai trong nhà, một lượng lớn dữ liệu riêng tư của người dùng sẽ bị thu thập. Ví dụ, chúng ta có thể đánh giá liệu có người trong nhà hay không bằng cách đọc dữ liệu sử dụng điện và nước. Vì vậy, làm thế nào để cung cấp dịch vụ mà không liên quan đến quyền riêng tư cũng là một vấn đề. Một số thông tin cá nhân có thể bị xóa trước khi xử lý dữ liệu, chẳng hạn như mặt nạ trong video. Chúng tôi nghĩ rằng điện toán trên các nguồn dữ liệu cạnh, tức là ở nhà, có thể là một cách tốt để bảo vệ quyền riêng tư và bảo mật dữ liệu.
Chúng tôi muốn nâng cao nhận thức về quyền riêng tư và bảo mật dữ liệu. Lấy mạng WIFI làm ví dụ, trong số 439 triệu kết nối mạng gia đình, 49% mạng WIFI không an toàn và 80% bộ định tuyến gia đình sử dụng mật khẩu mặc định. 89% điểm truy cập Wi-Fi công cộng không an toàn. Tất cả các bên liên quan bao gồm nhà cung cấp dịch vụ, nhà phát triển ứng dụng và hệ thống cũng như người dùng cuối cần lưu ý rằng quyền riêng tư của người dùng có thể bị vi phạm. Máy ảnh, máy theo dõi sức khỏe và thậm chí cả đồ chơi WIFI có thể được kết nối bởi những người khác nếu không được bảo vệ.
Vấn đề thứ hai cần đề cập là quyền sở hữu dữ liệu. Trong các ứng dụng di động, dữ liệu của người dùng cuối được nhà cung cấp dịch vụ lưu trữ và phân tích. Nhưng để dữ liệu ở nguyên vị trí được tạo và để người dùng sở hữu dữ liệu có thể bảo vệ quyền riêng tư tốt hơn. Tương tự như dữ liệu sức khỏe, dữ liệu người dùng được thu thập ở vùng biên nên được lưu giữ ở vùng biên và người dùng có quyền quyết định có cung cấp dữ liệu đó cho nhà cung cấp dịch vụ hay không.
Vấn đề thứ ba là có quá ít công cụ hiệu quả để bảo vệ quyền riêng tư và bảo mật dữ liệu ở rìa mạng. Một số thiết bị có tài nguyên hạn chế và không thể triển khai một số phương pháp bảo vệ an ninh hiện tại trên các thiết bị đó. Hơn nữa, môi trường biên mạng luôn thay đổi nên dễ bị tấn công và khó bảo vệ. Để bảo vệ quyền riêng tư, một số nền tảng như mHealth đã đề xuất các tiêu chuẩn lưu trữ dữ liệu sức khỏe thống nhất. Nhưng đối với điện toán cạnh, thiếu các công cụ để xử lý tất cả các loại dữ liệu.
6. Tối ưu hóa các chỉ số
Trong điện toán cạnh, có nhiều lớp với sức mạnh tính toán. Vậy khối lượng công việc nên được phân bổ như thế nào? Chúng ta có thể xem xét các chiến lược phân phối sau, chẳng hạn như phân phối tải đồng đều trong mỗi lớp hoặc hoàn thành càng nhiều tác vụ càng tốt trong mỗi lớp. Các trường hợp cực đoan đang hoạt động hoàn toàn trên điểm cuối hoặc hoàn toàn trên đám mây. Để chọn chiến lược phân bổ tốt nhất, trong phần này, chúng tôi thảo luận về một số chỉ số tối ưu hóa, bao gồm độ trễ, băng thông, mức tiêu thụ năng lượng và chi phí.
Độ trễ: Độ trễ là một trong những chỉ số quan trọng nhất để đo lường hiệu suất, đặc biệt là trong các ứng dụng hoặc dịch vụ tương tác. Máy chủ trong điện toán đám mây có thể cung cấp khả năng tính toán mạnh mẽ. Chúng có thể xử lý các tác vụ rất phức tạp như xử lý hình ảnh, nhận dạng giọng nói và nhiều tác vụ khác trong thời gian ngắn. Nhưng độ trễ không được xác định bởi thời gian tính toán. Độ trễ mạng dài có thể có tác động sâu sắc đến hoạt động của các ứng dụng tương tác/thời gian thực. Để giảm độ trễ, tốt nhất bạn nên thực hiện công việc ở lớp vật lý gần nhất.
Ví dụ, trong trường hợp thành phố thông minh, chúng ta có thể sử dụng điện thoại di động để xử lý ảnh cục bộ trước, sau đó chỉ cần gửi thông tin về trẻ em mất tích lên đám mây, thay vì tải tất cả ảnh lên, vì vậy phương pháp này nhanh hơn. Nhưng làm việc trên lớp vật lý gần nhất không phải lúc nào cũng là cách tốt nhất. Chúng ta cần xem xét việc sử dụng tài nguyên và tránh thời gian chờ đợi không cần thiết để có thể xây dựng hệ thống phân cấp logic tối ưu. Ví dụ: khi người dùng đang chơi trò chơi, vì tài nguyên máy tính của điện thoại di động đã bị chiếm dụng, tốt nhất nên chuyển ảnh đến cổng hoặc trung tâm vi mô gần nhất để xử lý.
Băng thông: Từ góc độ độ trễ, băng thông cao giúp giảm thời gian truyền. Để truyền khoảng cách ngắn, chúng ta có thể xây dựng băng thông cao để gửi dữ liệu đến biên. Một mặt, nếu dữ liệu có thể được xử lý ở rìa, thì độ trễ của hệ thống sẽ giảm đáng kể và băng thông ở rìa và đám mây cũng có thể được tiết kiệm. Ví dụ, trong trường hợp nhà thông minh, thông qua WIFI hoặc các phương thức truyền tốc độ cao khác, hầu hết tất cả dữ liệu đều có thể được xử lý tại cổng. Ngoài ra, độ tin cậy của đường truyền cũng được cải thiện, do khoảng cách truyền tương đối ngắn. Mặt khác, mặc dù cạnh không thể thực hiện tất cả công việc và giảm khoảng cách truyền, nhưng ít nhất nó có thể giảm đáng kể lượng dữ liệu tải lên bằng cách xử lý trước dữ liệu.
Mức tiêu thụ năng lượng: Pin là tài nguyên quý giá nhất đối với các thiết bị ở rìa mạng. Đối với lớp điểm cuối, thực hiện một số công việc ở biên giúp tiết kiệm năng lượng. Nhưng điều quan trọng là tạo ra sự cân bằng giữa mức tiêu thụ năng lượng tính toán và mức tiêu thụ năng lượng truyền dẫn. Nói chung, trước tiên chúng tôi xem xét các đặc tính tiêu thụ năng lượng của khối lượng công việc. Khối lượng tính toán có lớn không? Có bao nhiêu tài nguyên sẽ được sử dụng? Ngoài cường độ tín hiệu mạng, kích thước dữ liệu và băng thông khả dụng ảnh hưởng đến mức tiêu thụ năng lượng truyền dẫn. Nếu chi phí truyền dẫn nhỏ hơn chi phí tính toán cục bộ, thì tốt hơn là sử dụng tính toán biên.
Nhưng nếu chúng ta tập trung vào toàn bộ quá trình điện toán biên, không chỉ các điểm cuối, thì tổng mức tiêu thụ năng lượng sẽ là tổng mức tiêu thụ năng lượng của từng lớp. Tương tự như lớp điểm cuối, mức tiêu thụ năng lượng của mỗi lớp bao gồm mức tiêu thụ năng lượng tính toán cục bộ và mức tiêu thụ năng lượng truyền tải. Do đó, chiến lược phân bổ công việc tối ưu có thể thay đổi. Ví dụ: nếu trung tâm dữ liệu cục bộ bận, công việc sẽ được tải lên lớp trên để hoàn thành. So với tính toán tại điểm cuối, truyền multi-hop sẽ làm tăng đáng kể chi phí hoạt động của hệ thống và do đó làm tăng mức tiêu thụ năng lượng.
Chi phí: Từ quan điểm của các nhà cung cấp dịch vụ, chẳng hạn như YouTube, Amazon, v.v., điện toán biên cung cấp cho họ độ trễ và mức tiêu thụ năng lượng ít hơn, do đó tăng thông lượng dữ liệu và cải thiện trải nghiệm người dùng. Do đó, họ có thể kiếm được nhiều lợi nhuận hơn trong khi xử lý cùng một khối lượng công việc. Ví dụ: dựa trên sở thích của đa số cư dân, chúng tôi có thể đặt một video phổ biến nhất định ở rìa của lớp tòa nhà, để rìa của lớp thành phố có thể xử lý các tác vụ phức tạp hơn và có thể cải thiện thông lượng dữ liệu tổng thể. Đầu vào của nhà cung cấp dịch vụ là chi phí tạo và duy trì mỗi lớp. Để tận dụng tối đa dữ liệu cục bộ ở mỗi lớp, nhà cung cấp có thể tính phí người dùng theo vị trí của dữ liệu và cần phát triển các mô hình chi phí mới để đảm bảo lợi nhuận của nhà cung cấp dịch vụ và khả năng chấp nhận của người dùng.
tiêu đề phụ
04 Tóm tắt
Khi ai đó lần đầu tiên nói về việc bắt đầu kinh doanh trên Internet, mọi người nghĩ đó là một trò đùa. Đối với điện toán cạnh, có rất nhiều nghi ngờ ngay từ đầu. Sàn nhà máy có thể được coi là khu vực quan trọng nhất của sự phát triển CNTT và sự chuyển đổi tương tự sẽ xảy ra trong ngành công nghiệp giống như đã xảy ra trong lĩnh vực viễn thông 25 năm trước. Máy tính đa năng ở chế độ ảo, máy tính ảo, sẽ thay đổi tất cả điều đó. Nó xảy ra vì giá trị kinh tế hấp dẫn đến mức không thể cưỡng lại được.
Giờ đây, vì việc xử lý dữ liệu ở biên có thể đảm bảo thời gian phản hồi ngắn hơn và độ tin cậy cao hơn, nên ngày càng có nhiều dịch vụ được chuyển từ đám mây sang biên của mạng. Nếu bạn xử lý một lượng lớn dữ liệu ở biên, bạn có thể tránh gửi dữ liệu lên đám mây, do đó tiết kiệm băng thông. Sự phổ biến của Internet vạn vật và thiết bị di động đã thay đổi vai trò của ranh giới trong mô hình điện toán. Sẽ hiệu quả hơn khi xử lý dữ liệu ở rìa mạng.
Tóm lại giá trị của điện toán biên: Là một phần mở rộng của điện toán đám mây, điện toán biên mở rộng khả năng dịch vụ của điện toán đám mây đến biên gần hơn với người dùng, từ đó giúp các ứng dụng cung cấp trải nghiệm kinh doanh có độ trễ thấp hơn. Chúng tôi hy vọng rằng điện toán biên sẽ giúp quá trình xử lý dữ liệu hiệu quả hơn và cuộc sống tốt đẹp hơn trong tương lai.
Bài viết chỉ thể hiện quan điểm của tác giả và không cấu thành bất kỳ lời khuyên đầu tư nào
