Cơ sở dữ liệu – Wikipedia tiếng Việt

Một ví dụ về lấy dữ liệu đầu ra từ truy vấn cơ sở dữ liệu SQL.

Cơ sở dữ liệu (tiếng Anh: Database) là một tập hợp các dữ liệu có tổ chức liên quan đến nhau, thường được lưu trữ và truy cập điện tử từ hệ thống máy tính. Khi cơ sở dữ liệu phức tạp hơn, chúng thường được phát triển bằng cách sử dụng các kỹ thuật thiết kế và mô hình hóa chính thức.

Về mặt vật lý, máy chủ cơ sở dữ liệu là những máy tính chuyên sử dụng chứa cơ sở dữ liệu thực tiễn và chỉ chạy DBMS và ứng dụng tương quan. Các sever cơ sở dữ liệu thường là những máy tính đa bộ giải quyết và xử lý, với bộ nhớ hào phóng và mảng đĩa RAID được sử dụng để tàng trữ không thay đổi. RAID được sử dụng để phục sinh dữ liệu nếu bất kể đĩa nào bị lỗi. Bộ tăng cường cơ sở dữ liệu phần cứng, được liên kết với một hoặc nhiều sever trải qua kênh vận tốc cao, cũng được sử dụng trong thiên nhiên và môi trường giải quyết và xử lý thanh toán giao dịch khối lượng lớn. DBMS được tìm thấy ở TT của hầu hết những ứng dụng cơ sở dữ liệu. Các DBMS hoàn toàn có thể được thiết kế xây dựng xung quanh một hạt nhân đa nhiệm tùy chỉnh có tương hỗ mạng tích hợp, nhưng những DBMS tân tiến thường dựa vào một hệ quản lý và điều hành tiêu chuẩn để phân phối những tính năng này .Vì những DBMS là một thị trường quan trọng, những nhà sản xuất máy tính và tàng trữ thường tính đến những nhu yếu DBMS trong những kế hoạch tăng trưởng của riêng họ .

Cơ sở dữ liệu và các DBMS có thể được phân loại theo mô hình cơ sở dữ liệu mà chúng hỗ trợ (như quan hệ hoặc XML), loại máy tính mà chúng chạy trên (từ cụm máy chủ đến điện thoại di động), ngôn ngữ truy vấn (QL) được sử dụng để truy cập cơ sở dữ liệu (như SQL hoặc XQuery) và kỹ thuật nội bộ của chúng, ảnh hưởng đến hiệu suất, khả năng mở rộng, khả năng phục hồi và bảo mật.

Các kích cỡ, năng lực và hiệu suất của cơ sở dữ liệu và DBMS tương ứng của chúng đã tăng theo thứ tự độ lớn. Những sự ngày càng tăng hiệu suất này được kích hoạt bởi sự văn minh công nghệ tiên tiến trong những nghành nghề dịch vụ của bộ giải quyết và xử lý, bộ nhớ máy tính, tàng trữ máy tính và mạng máy tính. Sự tăng trưởng của công nghệ tiên tiến cơ sở dữ liệu hoàn toàn có thể được chia thành ba thời đại dựa trên quy mô hoặc cấu trúc dữ liệu : hướng đối tượng người dùng, SQL / quan hệ và hậu quan hệ .Hai quy mô dữ liệu hướng đối tượng người dùng khởi đầu chính là quy mô phân cấp và quy mô CODASYL ( quy mô mạng ) .Mô hình quan hệ, lần tiên phong được Edgar F. Codd đề xuất kiến nghị vào năm 1970, đã thoát ly khỏi truyền thống lịch sử này bằng cách nhấn mạnh vấn đề rằng những ứng dụng nên tìm kiếm dữ liệu theo nội dung, thay vì theo những link. Mô hình quan hệ sử dụng những tập hợp những bảng kiểu sổ cái, mỗi bảng được sử dụng cho một loại thực thể khác nhau. Chỉ vào giữa những năm 1980, phần cứng máy tính đã trở nên đủ mạnh để cho phép tiến hành thoáng rộng những mạng lưới hệ thống quan hệ ( DBMS cộng với những ứng dụng ). Tuy nhiên, vào đầu những năm 1990, những mạng lưới hệ thống quan hệ chiếm lợi thế trong toàn bộ những ứng dụng giải quyết và xử lý dữ liệu quy mô lớn và Tính đến năm 2018 chúng vẫn chiếm lợi thế : IBM DB2, Oracle, MySQL và Microsoft SQL Server là DBMS được tìm kiếm nhiều nhất. [ 3 ] Ngôn ngữ cơ sở dữ liệu thống trị, SQL được tiêu chuẩn hóa cho quy mô quan hệ, đã ảnh hưởng tác động đến những ngôn từ cơ sở dữ liệu cho những quy mô dữ liệu khác. Cơ sở dữ liệu đối tượng người tiêu dùng được tăng trưởng vào những năm 1980 để khắc phục sự phiền phức của sự không tương thích trở kháng quan hệ đối tượng người tiêu dùng, dẫn đến việc đặt ra thuật ngữ ” hậu quan hệ ” và cũng là sự tăng trưởng của cơ sở dữ liệu quan hệ đối tượng người dùng lai .Thế hệ cơ sở dữ liệu hậu quan hệ tiếp theo vào cuối những năm 2000 được gọi là cơ sở dữ liệu NoQuery, ra mắt những kho tàng trữ khóa giá trị nhanh và cơ sở dữ liệu khuynh hướng tài liệu. Một ” thế hệ tiếp theo ” cạnh tranh đối đầu được gọi là cơ sở dữ liệu NewQuery đã thử tiến hành những quy mô mới giữ lại quy mô quan hệ / SQL trong khi hướng đến việc tương thích với hiệu suất cao của NoQuery so với những DBMS quan hệ có sẵn trên thị trường .

Những năm 1960, DBMS hướng đối tượng người dùng[sửa|sửa mã nguồn]

Cấu trúc cơ bản của mô hình cơ sở dữ liệu CODASYL hướng đối tượng

Sự ra đời của thuật ngữ cơ sở dữ liệu trùng khớp với sự sẵn có của bộ lưu trữ truy cập trực tiếp (đĩa và trống) từ giữa những năm 1960 trở đi. Thuật ngữ này thể hiện sự tương phản với các hệ thống dựa trên băng từ trước đây, cho phép sử dụng tương tác được chia sẻ thay vì xử lý hàng ngày. Từ điển tiếng Anh Oxford trích dẫn một báo cáo năm 1962 của Tập đoàn phát triển hệ thống California là người đầu tiên sử dụng thuật ngữ “cơ sở dữ liệu” theo nghĩa kỹ thuật cụ thể.[4]

Khi máy tính tăng trưởng về vận tốc và năng lực, 1 số ít mạng lưới hệ thống cơ sở dữ liệu đa năng đã Open ; vào giữa những năm 1960, 1 số ít mạng lưới hệ thống như vậy đã được đưa vào sử dụng thương mại. Sự chăm sóc đến một tiêu chuẩn khởi đầu tăng lên và Charles Bachman, tác giả của một mẫu sản phẩm như vậy, Kho dữ liệu tích hợp ( IDS ), đã xây dựng ” Nhóm trách nhiệm cơ sở dữ liệu ” trong CODASYL, nhóm chịu nghĩa vụ và trách nhiệm tạo và chuẩn hóa COBOL. Năm 1971, Nhóm Nhiệm vụ Cơ sở dữ liệu đã đưa ra tiêu chuẩn của họ, thường được gọi là ” chiêu thức CODASYL “, và ngay sau đó, 1 số ít mẫu sản phẩm thương mại dựa trên chiêu thức này đã được đưa vào thị trường .Cách tiếp cận CODASYL dựa trên hướng đối tượng người dùng ” thủ công bằng tay ” của tập dữ liệu được link được tạo thành một mạng lớn. Các ứng dụng hoàn toàn có thể tìm thấy những bản ghi theo một trong ba giải pháp :

  1. Sử dụng khóa chính (được gọi là khóa CALC, thường được thực hiện bằng cách băm)
  2. hướng đối tượng các mối quan hệ (được gọi là bộ) từ bản ghi này sang bản ghi khác
  3. Quét tất cả các hồ sơ theo thứ tự liên tiếp

Các mạng lưới hệ thống sau này đã thêm cây B để phân phối những đường dẫn truy vấn thay thế sửa chữa. Nhiều cơ sở dữ liệu CODASYL cũng đã thêm một ngôn từ truy vấn rất đơn thuần. Tuy nhiên, trong lần kiểm tra sau cuối, CODASYL rất phức tạp và cần được huấn luyện và đào tạo và nỗ lực đáng kể để tạo ra những ứng dụng hữu dụng .

IBM cũng có DBMS của riêng họ vào năm 1966, được gọi là Hệ thống quản lý thông tin (IMS). IMS là sự phát triển của phần mềm được viết cho chương trình Apollo trên System/360. IMS nói chung tương tự khái niệm với CODASYL, nhưng đã sử dụng một hệ thống phân cấp chặt chẽ cho mô hình hướng đối tượng dữ liệu thay vì mô hình mạng của CODASYL. Cả hai khái niệm này sau đó được gọi là cơ sở dữ liệu hướng đối tượng do cách truy cập dữ liệu và bài thuyết trình Turing Award năm 1973 của Bachman là The Programmer as Navigator. IMS được phân loại như một cơ sở dữ liệu phân cấp. Cơ sở dữ liệu TOTAL của IDMS và Cincom Systems được phân loại là cơ sở dữ liệu mạng. IMS vẫn được sử dụng Tính đến năm 2014 .[5]

Những năm 1970, DBMS quan hệ[sửa|sửa mã nguồn]

Edgar Codd làm việc tại IBM ở San Jose, California, tại một trong những văn phòng của họ, chủ yếu liên quan đến việc phát triển các hệ thống đĩa cứng. Ông không hài lòng với mô hình hướng đối tượng của phương pháp CODASYL, đáng chú ý là thiếu cơ sở “tìm kiếm”. Năm 1970, ông đã viết một số bài báo phác thảo một cách tiếp cận mới để xây dựng cơ sở dữ liệu mà cuối cùng đã đạt đến đỉnh cao trong bài A Relational Model of Data for Large Shared Data Banks.

Trong bài báo này, ông đã mô tả một hệ thống mới để lưu trữ và làm việc với các cơ sở dữ liệu lớn. Thay vì các bản ghi được lưu trữ trong một số loại danh sách các bản ghi dạng tự do được liên kết như trong CODASYL, ý tưởng của Codd là sử dụng ” bảng ” các bản ghi có độ dài cố định, với mỗi bảng được sử dụng cho một loại thực thể khác nhau. Một hệ thống danh sách liên kết sẽ rất kém hiệu quả khi lưu trữ cơ sở dữ liệu “thưa thớt” trong đó một số dữ liệu cho bất kỳ một bản ghi nào có thể bị bỏ trống. Mô hình quan hệ đã giải quyết điều này bằng cách chia dữ liệu thành một loạt các bảng (hoặc quan hệ) được chuẩn hóa, với các phần tử tùy chọn được chuyển ra khỏi bảng chính đến nơi chúng chỉ chiếm phòng nếu cần. Dữ liệu có thể được chèn, xóa và chỉnh sửa tự do trong các bảng này, với DBMS thực hiện bất kỳ bảo trì nào cần thiết để hiển thị chế độ xem bảng cho ứng dụng / người dùng.

Trong mô hình quan hệ, các bản ghi được “liên kết” bằng các khóa ảo không được lưu trữ trong cơ sở dữ liệu nhưng được xác định là cần thiết giữa các dữ liệu có trong các bản ghi.
Mô hình quan hệ cũng được cho phép nội dung của cơ sở dữ liệu tăng trưởng mà không cần viết lại link và con trỏ. Phần quan hệ xuất phát từ những thực thể tham chiếu những thực thể khác trong mối quan hệ được gọi là mối quan hệ một-nhiều, như quy mô phân cấp truyền thống lịch sử và mối quan hệ nhiều-nhiều, như quy mô hướng đối tượng người dùng ( mạng ). Do đó, một quy mô quan hệ hoàn toàn có thể bộc lộ cả quy mô phân cấp và hướng đối tượng người dùng, cũng như quy mô bảng gốc của nó, được cho phép quy mô thuần túy hoặc tích hợp theo ba quy mô này, như ứng dụng nhu yếu .

Ví dụ, việc sử dụng phổ biến hệ thống cơ sở dữ liệu là theo dõi thông tin về người dùng, tên, thông tin đăng nhập, địa chỉ và số điện thoại khác nhau. Theo cách tiếp cận hướng đối tượng, tất cả các dữ liệu này sẽ được đặt trong một bản ghi và các mục không sử dụng sẽ không được đặt trong cơ sở dữ liệu. Theo cách tiếp cận quan hệ, dữ liệu sẽ được chuẩn hóa thành bảng người dùng, bảng địa chỉ và bảng số điện thoại (ví dụ). Bản ghi sẽ được tạo trong các bảng tùy chọn này chỉ khi địa chỉ hoặc số điện thoại thực sự được cung cấp.

Liên kết thông tin lại với nhau là chìa khóa cho mạng lưới hệ thống này. Trong quy mô quan hệ, 1 số ít thông tin được sử dụng làm ” khóa “, xác lập duy nhất một bản ghi đơn cử. Khi thông tin được tích lũy về người dùng, thông tin được tàng trữ trong những bảng tùy chọn sẽ được tìm thấy bằng cách tìm kiếm khóa này. Chẳng hạn, nếu tên đăng nhập của người dùng là duy nhất, địa chỉ và số điện thoại cảm ứng của người dùng đó sẽ được ghi lại với tên đăng nhập làm khóa. Việc ” link lại ” những dữ liệu tương quan trở lại thành một bộ sưu tập đơn thuần là điều mà những ngôn từ máy tính truyền thống lịch sử không được phong cách thiết kế cho .

Giống như cách tiếp cận hướng đối tượng sẽ yêu cầu các chương trình lặp để thu thập các bản ghi, phương pháp quan hệ sẽ yêu cầu các vòng lặp để thu thập thông tin về bất kỳ một bản ghi nào. Các đề xuất của Codd là một ngôn ngữ được định hướng theo tập hợp, sau này sẽ sinh ra SQL phổ biến. Sử dụng một nhánh toán học được gọi là tính toán tuple, ông đã chứng minh rằng một hệ thống như vậy có thể hỗ trợ tất cả các hoạt động của cơ sở dữ liệu thông thường (chèn, cập nhật, v.v.) cũng như cung cấp một hệ thống đơn giản để tìm và trả về các tập hợp dữ liệu trong một thao tác.

Bài báo của Codd đã được hai người tại Berkeley, Eugene Wong và Michael Stonebraker chú ý quan tâm. Họ đã khởi đầu một dự án Bất Động Sản được gọi là INGRES bằng cách sử dụng nguồn vốn đã được phân chia cho một dự án Bất Động Sản cơ sở dữ liệu địa lý và những lập trình viên sinh viên để tạo mã. Bắt đầu từ năm 1973, INGRES đã phân phối những mẫu sản phẩm thử nghiệm tiên phong thường sẵn sàng chuẩn bị để sử dụng thoáng đãng vào năm 1979. INGRES tựa như như System R theo một số ít cách, gồm có cả việc sử dụng ” ngôn từ ” để truy vấn dữ liệu, được gọi là QUEL. Theo thời hạn, INGRES chuyển sang tiêu chuẩn SQL mới nổi .

Bản thân IBM đã thực hiện một thử nghiệm thực hiện mô hình quan hệ, PRTV và một mô hình sản xuất, Business System 12, cả hai đều đã ngừng hoạt động. Honeywell đã viết MRDS cho Multics, và bây giờ có hai triển khai mới: Alphora Dataphor và Rel. Hầu hết các triển khai DBMS khác thường được gọi là quan hệ thực sự là các DBMS SQL.

Năm 1970, Đại học Michigan đã khởi đầu tăng trưởng Hệ thống quản trị thông tin MICRO dựa trên quy mô Dữ liệu triết lý tập hợp của DL Childs. MICRO đã được sử dụng để quản trị những tập dữ liệu rất lớn bởi Bộ Lao động Mỹ, Cục Bảo vệ Môi trường Mỹ, và những nhà nghiên cứu từ Đại học Alberta, trường Đại học Michigan, và trường Đại học Wayne State. Nó chạy trên những máy tính lớn của IBM sử dụng Hệ thống đầu cuối Michigan. [ 11 ] Hệ thống vẫn được sử dụng cho đến năm 1998 .

Phương pháp tích hợp[sửa|sửa mã nguồn]

Trong những năm 1970 và 1980, những nỗ lực đã được thực thi để thiết kế xây dựng những mạng lưới hệ thống cơ sở dữ liệu với phần cứng và ứng dụng tích hợp. Triết lý cơ bản là sự tích hợp như vậy sẽ phân phối hiệu suất cao hơn với ngân sách thấp hơn. Ví dụ là IBM System / 38, việc cung ứng Teradata sớm và máy cơ sở dữ liệu Britton Lee, Inc .Một cách tiếp cận khác để tương hỗ phần cứng cho quản trị cơ sở dữ liệu là bộ tăng cường CAFS của ICL, bộ tinh chỉnh và điều khiển đĩa phần cứng với năng lực tìm kiếm được lập trình. Về lâu dài hơn, những nỗ lực này thường không thành công xuất sắc vì những máy cơ sở dữ liệu chuyên sử dụng không hề theo kịp sự tăng trưởng và tân tiến nhanh gọn của những máy tính đa năng. Do đó, hầu hết những mạng lưới hệ thống cơ sở dữ liệu lúc bấy giờ là những mạng lưới hệ thống ứng dụng chạy trên phần cứng đa năng, sử dụng tàng trữ dữ liệu máy tính đa năng. Tuy nhiên, ý tưởng sáng tạo này vẫn được 1 số ít công ty như Netezza và Oracle ( Exadata ) theo đuổi .

Cuối những năm 1970, SQL DBMS[sửa|sửa mã nguồn]

IBM bắt đầu làm việc trên một hệ thống nguyên mẫu dựa trên các khái niệm của Codd là System R vào đầu những năm 1970. Phiên bản đầu tiên đã sẵn sàng vào năm 1974/5 và sau đó bắt đầu hoạt động trên các hệ thống nhiều bảng trong đó dữ liệu có thể được phân tách để tất cả dữ liệu cho một bản ghi (một số trong đó là tùy chọn) không phải được lưu trữ trong một “chunk” lớn. Các phiên bản đa người dùng sau đó đã được khách hàng thử nghiệm vào năm 1978 và 1979, vào thời điểm đó, một ngôn ngữ truy vấn được tiêu chuẩn hóa – SQL[cần dẫn nguồn] – đã được thêm vào. Các ý tưởng của Codd đã tự thiết lập cả khả thi và vượt trội so với CODASYL, thúc đẩy IBM phát triển một phiên bản sản xuất thực sự của System R, được gọi là SQL/DS, và sau đó là Database 2 (DB2).

Cơ sở dữ liệu Oracle của Larry Ellison ( hay đơn thuần hơn là Oracle ) mở màn từ một chuỗi khác, dựa trên những tài liệu của IBM về Hệ thống R. Mặc dù việc tiến hành Oracle V1 đã được triển khai xong vào năm 1978, nhưng mãi đến khi Oracle Phiên bản 2 vượt mặt IBM trên thị trường vào năm 1979. [ 12 ]Stonoplker liên tục vận dụng những bài học kinh nghiệm từ INGRES để tăng trưởng cơ sở dữ liệu mới, Postgres, hiện được gọi là PostgreQuery. PostgreSQL thường được sử dụng cho những ứng dụng quan trọng toàn thế giới ( những cơ quan ĐK tên miền. org và. info sử dụng nó làm kho tàng trữ dữ liệu chính của họ, cũng như nhiều công ty lớn và tổ chức triển khai kinh tế tài chính ) .Ở Thụy Điển, bài báo của Codd cũng được đọc và Mimer SQL được tăng trưởng từ giữa những năm 1970 tại Đại học Uppsala. Năm 1984, dự án Bất Động Sản này được hợp nhất thành một doanh nghiệp độc lập .

Một mô hình dữ liệu khác, mô hình quan hệ thực thể, xuất hiện vào năm 1976 và đã trở nên phổ biến cho thiết kế cơ sở dữ liệu vì nó nhấn mạnh một mô tả quen thuộc hơn so với mô hình quan hệ trước đó. Sau đó, các cấu trúc mối quan hệ thực thể được trang bị thêm như một cấu trúc mô hình dữ liệu cho mô hình quan hệ và sự khác biệt giữa hai cấu trúc đã trở nên không liên quan.[cần dẫn nguồn]

Những năm 1980, trên máy tính để bàn[sửa|sửa mã nguồn]

Những năm 1980 mở ra thời đại của máy tính để bàn. Các máy tính mới trao quyền cho người dùng của họ với những bảng tính như Lotus 1-2-3 và ứng dụng cơ sở dữ liệu như dBASE. Sản phẩm dBASE rất nhẹ và thuận tiện cho bất kể người dùng máy tính nào hiểu được. C. Wayne Ratliff, người tạo ra dBASE, đã công bố : ” dBASE khác với những chương trình như BASIC, C, FORTRAN và COBOL ở chỗ rất nhiều việc làm dơ bẩn đã được triển khai. Thao tác dữ liệu được triển khai bởi dBASE thay vì người dùng, thế cho nên người dùng hoàn toàn có thể tập trung chuyên sâu vào những gì anh ta đang làm, thay vì phải làm rối với những chi tiết cụ thể bẩn của việc mở, đọc và đóng tệp và quản trị phân chia khoảng trống. ” [ 13 ] dBASE là một trong những ứng dụng hút khách số 1 trong những năm 1980 và đầu những năm 1990 .

Những năm 1990, hướng đối tượng người dùng[sửa|sửa mã nguồn]

Những năm 1990, cùng với sự ngày càng tăng trong lập trình hướng đối tượng người dùng, đã tận mắt chứng kiến sự tăng trưởng về cách giải quyết và xử lý dữ liệu trong những cơ sở dữ liệu khác nhau. Các lập trình viên và nhà phong cách thiết kế mở màn coi dữ liệu trong cơ sở dữ liệu của họ là đối tượng người dùng. Điều đó có nghĩa là nếu dữ liệu của một người nằm trong cơ sở dữ liệu, những thuộc tính của người đó, như địa chỉ, số điện thoại cảm ứng và tuổi của họ, giờ đây được coi là thuộc về người đó thay vì dữ liệu không tương quan. Điều này được cho phép những mối quan hệ giữa dữ liệu là quan hệ với những đối tượng người tiêu dùng và thuộc tính của chúng chứ không phải cho những trường riêng không liên quan gì đến nhau. [ 14 ] Thuật ngữ ” không khớp trở kháng quan hệ đối tượng người dùng ” đã miêu tả sự phiền phức của việc dịch giữa những đối tượng người dùng được lập trình và những bảng cơ sở dữ liệu. Cơ sở dữ liệu đối tượng người dùng và cơ sở dữ liệu quan hệ đối tượng người tiêu dùng nỗ lực xử lý yếu tố này bằng cách phân phối ngôn từ hướng đối tượng người tiêu dùng ( đôi lúc là phần lan rộng ra cho SQL ) mà những lập trình viên hoàn toàn có thể sử dụng thay thế sửa chữa cho SQL trọn vẹn quan hệ. Về phía lập trình, những thư viện được gọi là ánh xạ quan hệ đối tượng người dùng ( ORM ) cố gắng nỗ lực xử lý yếu tố tương tự như .

Những năm 2000, NoSQL và NewSQL[sửa|sửa mã nguồn]

Cơ sở dữ liệu XML là một loại cơ sở dữ liệu hướng tài liệu có cấu trúc, được cho phép truy vấn dựa trên những thuộc tính tài liệu XML. Cơ sở dữ liệu XML hầu hết được sử dụng trong những ứng dụng mà dữ liệu được xem thuận tiện dưới dạng tập hợp tài liệu, với cấu trúc hoàn toàn có thể biến hóa từ rất linh động đến rất cứng ngắc : ví dụ gồm có những bài báo khoa học, văn bằng bản quyền trí tuệ, hồ sơ thuế và hồ sơ nhân sự .Cơ sở dữ liệu NoSQL thường rất nhanh, không nhu yếu lược đồ bảng cố định và thắt chặt, tránh những hoạt động giải trí tham gia bằng cách tàng trữ dữ liệu không chuẩn hóa và được phong cách thiết kế để lan rộng ra theo chiều ngang .Trong những năm gần đây, có nhu yếu lớn về cơ sở dữ liệu phân tán ồ ạt với dung sai phân vùng cao, nhưng theo định lý CAP, mạng lưới hệ thống phân tán không hề đồng thời cung ứng sự bảo vệ tính đồng điệu, tính sẵn sàng chuẩn bị và phân vùng. Một mạng lưới hệ thống phân tán hoàn toàn có thể phân phối bất kể hai trong số những bảo vệ này cùng một lúc, nhưng không phải cả ba. Vì lý do đó, nhiều cơ sở dữ liệu NoSQL đang sử dụng cái được gọi là tính đồng nhất ở đầu cuối để phân phối cả bảo vệ dung sai phân vùng và tính chuẩn bị sẵn sàng với mức độ thống nhất dữ liệu giảm .NewSQL là một lớp cơ sở dữ liệu quan hệ văn minh nhằm mục đích phân phối hiệu năng hoàn toàn có thể lan rộng ra tương tự như của những mạng lưới hệ thống NoQuery để giải quyết và xử lý khối lượng việc làm giải quyết và xử lý thanh toán giao dịch trực tuyến ( đọc-ghi ) trong khi vẫn sử dụng SQL và duy trì bảo vệ ACID của mạng lưới hệ thống cơ sở dữ liệu truyền thống cuội nguồn .

Trường hợp sử dụng[sửa|sửa mã nguồn]

Cơ sở dữ liệu được sử dụng để tương hỗ những hoạt động giải trí nội bộ của những tổ chức triển khai và để củng cố những tương tác trực tuyến với người mua và nhà sản xuất ( xem ứng dụng Doanh nghiệp ) .Cơ sở dữ liệu được sử dụng để chứa thông tin quản trị và dữ liệu chuyên ngành hơn, ví dụ điển hình như dữ liệu kỹ thuật hoặc quy mô kinh tế tài chính. Ví dụ gồm có mạng lưới hệ thống thư viện máy tính, mạng lưới hệ thống đặt chỗ chuyến bay, mạng lưới hệ thống kiểm kê bộ phận máy tính và nhiều mạng lưới hệ thống quản trị nội dung tàng trữ những website dưới dạng bộ sưu tập những website trong cơ sở dữ liệu .
Một cách để phân loại cơ sở dữ liệu tương quan đến loại nội dung của chúng, ví dụ : thư mục, tài liệu văn bản, thống kê hoặc đối tượng người dùng đa phương tiện. Một cách khác là theo nghành nghề dịch vụ ứng dụng của họ, ví dụ : kế toán, sáng tác nhạc, phim ảnh, ngân hàng nhà nước, sản xuất hoặc bảo hiểm. Cách thứ ba là theo một số ít góc nhìn kỹ thuật, ví dụ điển hình như cấu trúc cơ sở dữ liệu hoặc loại giao diện. Phần này liệt kê 1 số ít tính từ được sử dụng để miêu tả những loại cơ sở dữ liệu khác nhau .

Các kiến trúc DBMS song song chính được tạo ra bởi kiến trúc phần cứng cơ bản là:

  • Kiến trúc bộ nhớ dùng chung, nơi nhiều bộ xử lý chia sẻ không gian bộ nhớ chính, cũng như lưu trữ dữ liệu khác.
  • Kiến trúc đĩa chia sẻ, trong đó mỗi đơn vị xử lý (thường bao gồm nhiều bộ xử lý) có bộ nhớ chính, nhưng tất cả các đơn vị chia sẻ bộ lưu trữ khác.
  • Kiến trúc không chia sẻ, trong đó mỗi đơn vị xử lý có bộ nhớ chính và bộ lưu trữ khác.
  • Cơ sở dữ liệu xác suất sử dụng logic mờ để rút ra các kết luận từ dữ liệu không chính xác.
  • Cơ sở dữ liệu thời gian thực xử lý các giao dịch đủ nhanh để kết quả quay trở lại và được xử lý ngay lập tức.
  • Một cơ sở dữ liệu không gian có thể lưu trữ dữ liệu với các tính năng đa chiều. Các truy vấn trên dữ liệu đó bao gồm các truy vấn dựa trên vị trí, như “Khách sạn gần nhất ở đâu trong khu vực của tôi?”.
  • Cơ sở dữ liệu tạm thời có các khía cạnh thời gian tích hợp, ví dụ mô hình dữ liệu tạm thời và phiên bản tạm thời của SQL. Cụ thể hơn, các khía cạnh thời gian thường bao gồm thời gian hợp lệ và thời gian giao dịch.
  • Cơ sở dữ liệu định hướng thuật ngữ xây dựng trên cơ sở dữ liệu hướng đối tượng, thường được tùy chỉnh cho một trường cụ thể.
  • Một cơ sở dữ liệu phi cấu trúc được dự định để lưu trữ theo cách có thể quản lý và bảo vệ các đối tượng đa dạng không phù hợp tự nhiên và thuận tiện trong các cơ sở dữ liệu chung. Nó có thể bao gồm email, tài liệu, tạp chí, đối tượng đa phương tiện, v.v. Tên có thể gây hiểu nhầm vì một số đối tượng có thể có cấu trúc cao. Tuy nhiên, toàn bộ bộ sưu tập đối tượng có thể không phù hợp với khung cấu trúc được xác định trước. Hầu hết các DBMS được thiết lập hiện nay đều hỗ trợ dữ liệu phi cấu trúc theo nhiều cách khác nhau và các DBMS chuyên dụng mới đang xuất hiện.

Tương tác cơ sở dữ liệu[sửa|sửa mã nguồn]

Hệ thống quản trị cơ sở dữ liệu[sửa|sửa mã nguồn]

Connolly và Begg định nghĩa Hệ thống quản trị cơ sở dữ liệu ( DBMS ) là một ” mạng lưới hệ thống ứng dụng được cho phép người dùng xác lập, tạo, duy trì và trấn áp truy vấn vào cơ sở dữ liệu ” .Từ viết tắt DBMS đôi lúc được lan rộng ra để chỉ ra quy mô cơ sở dữ liệu cơ bản, với RDBMS cho quy mô quan hệ, OODBMS hoặc ORDBMS cho quy mô đối tượng người dùng ( xu thế ) và ORDBMS cho Quan hệ đối tượng người tiêu dùng. Các phần lan rộng ra khác hoàn toàn có thể chỉ ra một số ít đặc thù khác, ví dụ điển hình như DDBMS cho mạng lưới hệ thống quản trị cơ sở dữ liệu phân tán .Các công dụng được cung ứng bởi một DBMS hoàn toàn có thể rất khác nhau. Chức năng cốt lõi là tàng trữ, truy xuất và update dữ liệu. Codd yêu cầu những tính năng và dịch vụ sau đây, DBMS có mục tiêu chung được cung ứng rất đầy đủ :

  • Lưu trữ, truy xuất và cập nhật dữ liệu
  • Danh mục người dùng có thể truy cập hoặc từ điển dữ liệu mô tả siêu dữ liệu
  • Hỗ trợ giao dịch và đồng thời
  • Các cơ sở phục hồi cơ sở dữ liệu nên bị hỏng
  • Hỗ trợ ủy quyền truy cập và cập nhật dữ liệu
  • Hỗ trợ truy cập từ các địa điểm từ xa
  • Thực thi các ràng buộc để đảm bảo dữ liệu trong cơ sở dữ liệu tuân thủ các quy tắc nhất định

Nhìn chung, DBMS sẽ cung ứng một bộ những tiện ích cho những mục tiêu như vậy hoàn toàn có thể thiết yếu để quản trị cơ sở dữ liệu một cách hiệu suất cao, gồm có những tiện ích nhập, xuất, giám sát, phân mảnh và nghiên cứu và phân tích. Phần cốt lõi của DBMS tương tác giữa cơ sở dữ liệu và giao diện ứng dụng nhiều lúc được gọi là công cụ cơ sở dữ liệu .Thông thường những DBMS sẽ có những tham số thông số kỹ thuật hoàn toàn có thể được kiểm soát và điều chỉnh tĩnh và động, ví dụ : lượng bộ nhớ chính tối đa trên sever mà cơ sở dữ liệu hoàn toàn có thể sử dụng. Xu hướng là giảm thiểu số lượng thông số kỹ thuật bằng tay thủ công và so với những trường hợp như cơ sở dữ liệu nhúng, nhu yếu nhắm tiềm năng quản trị tự động hóa là tối quan trọng .Các DBMS doanh nghiệp lớn có khuynh hướng tăng kích cỡ và công dụng và hoàn toàn có thể tương quan đến hàng ngàn năm nỗ lực tăng trưởng của con người trong suốt cuộc sống của họ. [ a ]DBMS nhiều người dùng sớm thường chỉ được cho phép ứng dụng cư trú trên cùng một máy tính có quyền truy vấn trải qua thiết bị đầu cuối hoặc ứng dụng mô phỏng thiết bị đầu cuối. Kiến trúc sever của máy khách là một sự tăng trưởng trong đó ứng dụng nằm trên màn hình hiển thị máy khách và cơ sở dữ liệu trên sever được cho phép giải quyết và xử lý được phân phối. Điều này tăng trưởng thành một kiến trúc đa nhiệm phối hợp những sever ứng dụng và máy chủ web với giao diện người dùng cuối trải qua trình duyệt web với cơ sở dữ liệu chỉ được liên kết trực tiếp với tầng liền kề .DBMS có mục tiêu chung sẽ phân phối những giao diện lập trình ứng dụng công cộng ( API ) và tùy chọn bộ giải quyết và xử lý cho những ngôn từ cơ sở dữ liệu như SQL để cho phép những ứng dụng được viết để tương tác với cơ sở dữ liệu. DBMS có mục tiêu đặc biệt quan trọng hoàn toàn có thể sử dụng API riêng và được tùy chỉnh và link đơn cử với một ứng dụng. Ví dụ, một mạng lưới hệ thống email triển khai nhiều tính năng của DBMS có mục tiêu chung như chèn tin nhắn, xóa tin nhắn, giải quyết và xử lý tệp đính kèm, tra cứu list chặn, link tin nhắn một địa chỉ email, v.v. .

Tương tác bên ngoài với cơ sở dữ liệu sẽ thông qua một chương trình ứng dụng có giao diện với DBMS. Điều này có thể bao gồm từ một công cụ cơ sở dữ liệu cho phép người dùng thực hiện các truy vấn SQL bằng văn bản hoặc bằng đồ họa, đến một trang web tình cờ sử dụng cơ sở dữ liệu để lưu trữ và tìm kiếm thông tin.

Giao diện chương trình ứng dụng[sửa|sửa mã nguồn]

Một lập trình viên sẽ lập trình những tương tác vào cơ sở dữ liệu ( nhiều lúc được gọi là nguồn dữ liệu ) trải qua giao diện chương trình ứng dụng ( API ) hoặc trải qua ngôn từ cơ sở dữ liệu. API hoặc ngôn từ đơn cử được chọn sẽ cần được DBMS tương hỗ, hoàn toàn có thể gián tiếp trải qua bộ giải quyết và xử lý trước hoặc API bắc cầu. Một số API nhằm mục đích mục tiêu độc lập với cơ sở dữ liệu, ODBC là một ví dụ thường được biết đến. Các API thông dụng khác gồm có JDBC và ADO.NET.

Ngôn ngữ cơ sở dữ liệu[sửa|sửa mã nguồn]

Ngôn ngữ cơ sở dữ liệu là ngôn từ có mục tiêu đặc biệt quan trọng, được cho phép một hoặc nhiều tác vụ sau, nhiều lúc được phân biệt là ngôn từ con :

  • Ngôn ngữ kiểm soát dữ liệu (DCL) – kiểm soát truy cập dữ liệu;
  • Ngôn ngữ định nghĩa dữ liệu (DDL) – xác định các loại dữ liệu như tạo, thay đổi hoặc xóa và các mối quan hệ giữa chúng;
  • Ngôn ngữ thao tác dữ liệu (DML) – thực hiện các tác vụ như chèn, cập nhật hoặc xóa các lần xuất hiện dữ liệu;
  • Ngôn ngữ truy vấn dữ liệu (DQL) – cho phép tìm kiếm thông tin và tính toán thông tin dẫn xuất.

Ngôn ngữ cơ sở dữ liệu là đơn cử cho một quy mô dữ liệu đơn cử. Các ví dụ đáng quan tâm gồm có :

  • SQL kết hợp các vai trò của định nghĩa dữ liệu, thao tác dữ liệu và truy vấn trong một ngôn ngữ. Đó là một trong những ngôn ngữ thương mại đầu tiên cho mô hình quan hệ, mặc dù nó rời khỏi một số khía cạnh từ mô hình quan hệ như được mô tả bởi Codd (ví dụ, các hàng và cột của bảng có thể được đặt hàng). SQL đã trở thành một tiêu chuẩn của Viện Tiêu chuẩn Quốc gia Hoa Kỳ (ANSI) vào năm 1986 và của Tổ chức Tiêu chuẩn hóa Quốc tế (ISO) năm 1987. Các tiêu chuẩn đã được nâng cao thường xuyên kể từ khi được hỗ trợ (với mức độ phù hợp khác nhau) DBMS quan hệ. [24]
  • OQL là một tiêu chuẩn ngôn ngữ mô hình đối tượng (từ Nhóm quản lý dữ liệu đối tượng). Nó đã ảnh hưởng đến thiết kế của một số ngôn ngữ truy vấn mới hơn như JDOQL và EJB QL.
  • XQuery là ngôn ngữ truy vấn XML tiêu chuẩn được triển khai bởi các hệ thống cơ sở dữ liệu XML như MarkLogic và eXist, bởi các cơ sở dữ liệu quan hệ có khả năng XML như Oracle và DB2 và cả các bộ xử lý XML trong bộ nhớ như Saxon.
  • SQL/XML kết hợp XQuery với SQL.

Một ngôn từ cơ sở dữ liệu cũng hoàn toàn có thể tích hợp những tính năng như :

  • Cấu hình và quản lý công cụ lưu trữ dành riêng cho DBMS
  • Tính toán để sửa đổi kết quả truy vấn, như đếm, tính tổng, tính trung bình, sắp xếp, nhóm và tham chiếu chéo
  • Hạn chế thực thi (ví dụ: trong cơ sở dữ liệu ô tô, chỉ cho phép một loại động cơ trên mỗi ô tô)
  • Phiên bản giao diện lập trình ứng dụng của ngôn ngữ truy vấn, để thuận tiện cho lập trình viên

Lưu trữ cơ sở dữ liệu là nơi chứa vật chất hóa vật lý của cơ sở dữ liệu. Nó bao gồm mức độ nội bộ (vật lý) trong kiến trúc cơ sở dữ liệu. Nó cũng chứa tất cả thông tin cần thiết (ví dụ: siêu dữ liệu, “dữ liệu về dữ liệu” và cấu trúc dữ liệu bên trong) để tái cấu trúc mức khái niệmcấp độ bên ngoài từ cấp độ bên trong khi cần. Đưa dữ liệu vào lưu trữ vĩnh viễn nói chung là trách nhiệm của công cụ cơ sở dữ liệu hay còn gọi là “công cụ lưu trữ”. Mặc dù DBMS thường truy cập thông qua hệ điều hành cơ bản (và thường sử dụng các hệ thống tệp của hệ điều hành làm trung gian để bố trí lưu trữ), các thuộc tính lưu trữ và cài đặt cấu hình là cực kỳ quan trọng đối với hoạt động hiệu quả của DBMS và do đó được duy trì chặt chẽ bởi quản trị cơ sở dữ liệu. Một DBMS, trong khi hoạt động, luôn có cơ sở dữ liệu của nó nằm trong một số loại lưu trữ (ví dụ: bộ nhớ và bộ nhớ ngoài). Dữ liệu cơ sở dữ liệu và thông tin cần thiết bổ sung, có thể với số lượng rất lớn, được mã hóa thành các bit. Dữ liệu thường nằm trong bộ lưu trữ trong các cấu trúc trông hoàn toàn khác với cách dữ liệu nhìn ở cấp độ khái niệm và bên ngoài, nhưng theo cách cố gắng tối ưu hóa (tốt nhất có thể) các cấu trúc này khi người dùng và chương trình cũng cần như để tính toán các loại thông tin cần thiết từ dữ liệu (ví dụ: khi truy vấn cơ sở dữ liệu).

Một số DBMS tương hỗ chỉ định mã hóa ký tự nào được sử dụng để tàng trữ dữ liệu, do đó, nhiều mã hóa hoàn toàn có thể được sử dụng trong cùng một cơ sở dữ liệu .Các cấu trúc tàng trữ cơ sở dữ liệu mức thấp khác nhau được sử dụng bởi công cụ tàng trữ để tuần tự hóa quy mô dữ liệu để nó hoàn toàn có thể được ghi vào phương tiện đi lại lựa chọn. Các kỹ thuật như lập chỉ mục hoàn toàn có thể được sử dụng để cải tổ hiệu suất. Lưu trữ thường thì là theo xu thế hàng, nhưng cũng có cơ sở dữ liệu đối sánh tương quan và khuynh hướng cột .

Quan điểm cụ thể hóa[sửa|sửa mã nguồn]

Thường dự phòng lưu trữ được sử dụng để tăng hiệu suất. Một ví dụ phổ biến là lưu trữ các khung nhìn cụ thể hóa, bao gồm các khung nhìn bên ngoài hoặc kết quả truy vấn thường xuyên cần thiết. Lưu trữ các quan điểm như vậy giúp tiết kiệm điện toán đắt tiền của chúng mỗi khi chúng cần thiết. Nhược điểm của các khung nhìn cụ thể hóa là chi phí phát sinh khi cập nhật chúng để giữ cho chúng được đồng bộ hóa với dữ liệu cơ sở dữ liệu được cập nhật ban đầu của chúng và chi phí dự phòng lưu trữ.

Sao chép nhân rộng[sửa|sửa mã nguồn]

Đôi khi, cơ sở dữ liệu sử dụng dự trữ tàng trữ bằng cách sao chép đối tượng người dùng cơ sở dữ liệu ( có một hoặc nhiều bản sao ) để tăng tính khả dụng của dữ liệu ( cả hai để cải tổ hiệu suất của nhiều người dùng cuối truy vấn vào cùng một đối tượng người tiêu dùng cơ sở dữ liệu và để phân phối năng lực phục sinh trong trường hợp không thành công xuất sắc một cơ sở dữ liệu phân tán ). Cập nhật của một đối tượng người tiêu dùng được nhân rộng cần phải được đồng điệu hóa trên những bản sao đối tượng người dùng. Trong nhiều trường hợp, hàng loạt cơ sở dữ liệu được nhân rộng .
Bảo mật cơ sở dữ liệu tương quan đến toàn bộ những góc nhìn khác nhau của việc bảo vệ nội dung cơ sở dữ liệu, chủ sở hữu và người dùng của nó. Nó gồm có từ bảo vệ khỏi việc sử dụng cơ sở dữ liệu trái phép có chủ ý đến cơ sở dữ liệu vô tình truy vấn bởi những thực thể trái phép ( ví dụ : một người hoặc một chương trình máy tính ) .Kiểm soát truy vấn cơ sở dữ liệu tương quan đến việc trấn áp ai ( một người hoặc một chương trình máy tính nhất định ) được phép truy vấn thông tin nào trong cơ sở dữ liệu. Thông tin hoàn toàn có thể gồm có những đối tượng người tiêu dùng cơ sở dữ liệu đơn cử ( vd hoặc những cấu trúc dữ liệu khác để truy vấn thông tin ). Các tinh chỉnh và điều khiển truy vấn cơ sở dữ liệu được thiết lập bởi nhân viên cấp dưới được ủy quyền đặc biệt quan trọng ( bởi chủ sở hữu cơ sở dữ liệu ) sử dụng những giao diện DBMS bảo mật thông tin chuyên sử dụng được bảo vệ .Điều này hoàn toàn có thể được quản trị trực tiếp trên cơ sở cá thể, hoặc bằng cách phân công những cá thể và độc quyền cho những nhóm, hoặc ( trong những quy mô phức tạp nhất ) trải qua việc phân công những cá thể và nhóm cho những vai trò sau đó được cấp quyền. Bảo mật dữ liệu ngăn người dùng trái phép xem hoặc update cơ sở dữ liệu. Sử dụng mật khẩu, người dùng được phép truy vấn vào hàng loạt cơ sở dữ liệu hoặc những tập hợp con của nó được gọi là ” những bộ phận con “. Ví dụ : cơ sở dữ liệu nhân viên cấp dưới hoàn toàn có thể chứa tổng thể dữ liệu về một nhân viên cấp dưới, nhưng một nhóm người dùng hoàn toàn có thể được phép chỉ xem dữ liệu bảng lương, trong khi những người khác chỉ được phép truy vấn vào lịch sử vẻ vang thao tác và dữ liệu y tế. Nếu DBMS phân phối một cách để tương tác nhập và update cơ sở dữ liệu, cũng như thẩm vấn nó, năng lực này được cho phép quản trị cơ sở dữ liệu cá thể .Bảo mật dữ liệu nói chung tương quan đến việc bảo vệ những khối dữ liệu đơn cử, cả về mặt vật lý ( nghĩa là khỏi tham nhũng, hoặc tàn phá hoặc xóa ; ví dụ : xem bảo mật thông tin vật lý ) hoặc lý giải chúng hoặc những phần của chúng so với thông tin có ý nghĩa ( ví dụ : nhìn vào chuỗi bit mà chúng gồm có, Kết luận số thẻ tín dụng hợp lệ đơn cử, ví dụ : xem mã hóa dữ liệu ) .Thay đổi và truy vấn những bản ghi nhật ký những người đã truy vấn thuộc tính nào, những gì đã được đổi khác và khi nó được đổi khác. Thương Mại Dịch Vụ ghi nhật ký được cho phép kiểm tra cơ sở dữ liệu pháp y sau đó bằng cách lưu giữ hồ sơ về những lần Open và biến hóa truy vấn. Đôi khi mã Lever ứng dụng được sử dụng để ghi lại những đổi khác thay vì để mã này vào cơ sở dữ liệu. Giám sát hoàn toàn có thể được thiết lập để cố gắng nỗ lực phát hiện những vi phạm bảo mật an ninh .

Giao dịch và giải quyết và xử lý thanh toán giao dịch đồng thời[sửa|sửa mã nguồn]

Các thanh toán giao dịch cơ sở dữ liệu hoàn toàn có thể được sử dụng để trình làng 1 số ít mức độ chịu lỗi và tính toàn vẹn dữ liệu sau khi hồi sinh sau sự cố. Giao dịch cơ sở dữ liệu là một đơn vị chức năng việc làm, thường đóng gói 1 số ít hoạt động giải trí trên cơ sở dữ liệu ( ví dụ : đọc đối tượng người tiêu dùng cơ sở dữ liệu, viết, lấy khóa, v.v. ), một sự trừu tượng được tương hỗ trong cơ sở dữ liệu và những mạng lưới hệ thống khác. Mỗi thanh toán giao dịch có những ranh giới được xác lập rõ về mặt thực thi chương trình / mã được gồm có trong thanh toán giao dịch đó ( được xác lập bởi người lập trình thanh toán giao dịch trải qua những lệnh thanh toán giao dịch đặc biệt quan trọng ) .Từ viết tắt ACID diễn đạt 1 số ít đặc thù lý tưởng của thanh toán giao dịch cơ sở dữ liệu : tính nguyên tử, tính đồng nhất, sự cô lập và độ bền .
Một cơ sở dữ liệu được thiết kế xây dựng với một DBMS không hề chuyển dời sang một DBMS khác ( nghĩa là DBMS khác không hề chạy nó ). Tuy nhiên, trong 1 số ít trường hợp, mong ước chuyển dời, chuyển dời cơ sở dữ liệu từ DBMS này sang DBMS khác. Các nguyên do hầu hết là kinh tế tài chính ( những DBMS khác nhau hoàn toàn có thể có tổng ngân sách chiếm hữu hoặc TCO khác nhau ), tính năng và hoạt động giải trí ( những DBMS khác nhau hoàn toàn có thể có những năng lực khác nhau ). Việc vận động và di chuyển tương quan đến việc quy đổi cơ sở dữ liệu từ loại DBMS này sang loại khác. Việc quy đổi phải duy trì ( nếu hoàn toàn có thể ) những ứng dụng tương quan đến cơ sở dữ liệu ( nghĩa là toàn bộ những chương trình ứng dụng tương quan ) còn nguyên vẹn. Do đó, những mức kiến trúc bên ngoài và khái niệm của cơ sở dữ liệu nên được duy trì trong quy trình quy đổi. Có thể mong ước rằng 1 số ít góc nhìn của Lever kiến trúc được duy trì. Di chuyển cơ sở dữ liệu phức tạp hoặc lớn hoàn toàn có thể là một dự án Bất Động Sản phức tạp và tốn kém ( một lần ), điều này cần được đưa vào quyết định hành động vận động và di chuyển. Điều này mặc dầu trong thực tiễn là những công cụ hoàn toàn có thể sống sót để giúp vận động và di chuyển giữa những DBMS đơn cử. Thông thường, nhà cung ứng DBMS phân phối những công cụ để giúp nhập cơ sở dữ liệu từ những DBMS phổ cập khác .

Xây dựng, bảo dưỡng và kiểm soát và điều chỉnh[sửa|sửa mã nguồn]

Sau khi phong cách thiết kế cơ sở dữ liệu cho một ứng dụng, quy trình tiến độ tiếp theo là kiến thiết xây dựng cơ sở dữ liệu. Thông thường, một DBMS có mục tiêu chung thích hợp hoàn toàn có thể được chọn để sử dụng cho mục tiêu này. DBMS phân phối những giao diện người dùng thiết yếu được sử dụng bởi những quản trị viên cơ sở dữ liệu để xác lập cấu trúc dữ liệu của ứng dụng thiết yếu trong quy mô dữ liệu tương ứng của DBMS. Các giao diện người dùng khác được sử dụng để chọn những tham số DBMS thiết yếu ( như tương quan đến bảo mật thông tin, tham số phân chia tàng trữ, v.v. ) .Khi cơ sở dữ liệu đã sẵn sàng chuẩn bị ( toàn bộ những cấu trúc dữ liệu và những thành phần thiết yếu khác được xác lập ), nó thường được điền với dữ liệu của ứng dụng khởi đầu ( khởi tạo cơ sở dữ liệu, thường là một dự án Bất Động Sản riêng không liên quan gì đến nhau ; trong nhiều trường hợp sử dụng giao diện DBMS chuyên được dùng tương hỗ chèn hàng loạt ) trước đó làm cho nó hoạt động giải trí. Trong 1 số ít trường hợp, cơ sở dữ liệu sẽ hoạt động giải trí trong khi trống dữ liệu ứng dụng và dữ liệu được tích góp trong quy trình hoạt động giải trí .Sau khi cơ sở dữ liệu được tạo, khởi tạo và điền vào nó cần được duy trì. Các tham số cơ sở dữ liệu khác nhau hoàn toàn có thể cần đổi khác và cơ sở dữ liệu hoàn toàn có thể cần được kiểm soát và điều chỉnh ( kiểm soát và điều chỉnh ) để có hiệu suất tốt hơn ; cấu trúc dữ liệu của ứng dụng hoàn toàn có thể được biến hóa hoặc thêm vào, những chương trình ứng dụng tương quan mới hoàn toàn có thể được viết để thêm vào tính năng của ứng dụng, v.v.

Sao lưu và Phục hồi[sửa|sửa mã nguồn]

Đôi khi, mong ước đưa cơ sở dữ liệu quay trở lại trạng thái trước đó ( vì nhiều nguyên do, ví dụ : những trường hợp khi phát hiện cơ sở dữ liệu bị lỗi do lỗi ứng dụng hoặc nếu nó đã được update với dữ liệu bị lỗi ). Để đạt được điều này, một hoạt động giải trí sao lưu được triển khai đôi lúc hoặc liên tục, trong đó mỗi trạng thái cơ sở dữ liệu mong ước ( nghĩa là những giá trị của dữ liệu và việc nhúng chúng vào cấu trúc dữ liệu của cơ sở dữ liệu ) được giữ trong những tệp sao lưu chuyên được dùng ( có nhiều kỹ thuật để thực thi điều này một cách hiệu suất cao ). Khi trạng thái này là thiết yếu, tức là khi người quản trị cơ sở dữ liệu quyết định hành động đưa cơ sở dữ liệu trở lại trạng thái này ( ví dụ : bằng cách chỉ định trạng thái này theo thời gian mong ước khi cơ sở dữ liệu ở trạng thái này ), những tệp này được sử dụng để Phục hồi trạng thái đó .

Phân tích tĩnh[sửa|sửa mã nguồn]

Các kỹ thuật nghiên cứu và phân tích tĩnh để xác định ứng dụng cũng hoàn toàn có thể được vận dụng trong ngữ cảnh của những ngôn từ truy vấn. Cụ thể, khung lý giải * Tóm tắt đã được lan rộng ra sang nghành ngôn từ truy vấn cho cơ sở dữ liệu quan hệ như một cách để tương hỗ những kỹ thuật gần đúng âm thanh. Ngữ nghĩa của những ngôn từ truy vấn hoàn toàn có thể được kiểm soát và điều chỉnh theo sự trừu tượng tương thích của miền dữ liệu đơn cử. Sự trừu tượng của mạng lưới hệ thống cơ sở dữ liệu quan hệ có nhiều ứng dụng mê hoặc, đặc biệt quan trọng, cho mục tiêu bảo mật thông tin, ví dụ điển hình như trấn áp truy vấn chi tiết cụ thể, hình mờ, v.v.

Các tính năng khác[sửa|sửa mã nguồn]

Các tính năng DBMS khác hoàn toàn có thể gồm có :

  • Nhật ký cơ sở dữ liệu – Điều này giúp giữ một lịch sử của các chức năng được thực hiện.
  • Thành phần đồ họa để sản xuất đồ thị và biểu đồ, đặc biệt là trong một hệ thống kho dữ liệu.
  • Trình tối ưu hóa truy vấn – Thực hiện tối ưu hóa truy vấn trên mọi truy vấn để chọn gói truy vấn hiệu quả (một phần thứ tự (cây) của các hoạt động) sẽ được thực hiện để tính kết quả truy vấn. Có thể được cụ thể cho một công cụ lưu trữ cụ thể.
  • Các công cụ hoặc móc để thiết kế cơ sở dữ liệu, lập trình ứng dụng, bảo trì chương trình ứng dụng, giám sát và phân tích hiệu suất cơ sở dữ liệu, giám sát cấu hình cơ sở dữ liệu, cấu hình phần cứng DBMS (DBMS và cơ sở dữ liệu liên quan có thể trải rộng trên máy tính, mạng và đơn vị lưu trữ) và ánh xạ cơ sở dữ liệu liên quan (đặc biệt là một DBMS phân tán), phân bổ lưu trữ và giám sát bố cục cơ sở dữ liệu, di chuyển lưu trữ, v.v.

Ngày càng có nhiều lời lôi kéo cho một mạng lưới hệ thống duy nhất phối hợp tổng thể những tính năng cốt lõi này vào cùng một khung kiến thiết xây dựng, kiểm tra và tiến hành để quản trị cơ sở dữ liệu và trấn áp nguồn. Mượn từ những tăng trưởng khác trong ngành công nghiệp ứng dụng, 1 số ít thị trường như ” DevOps cho cơ sở dữ liệu “. [ 27 ]

Thiết kế và quy mô[sửa|sửa mã nguồn]

Nhiệm vụ tiên phong của một nhà phong cách thiết kế cơ sở dữ liệu là tạo ra một quy mô dữ liệu khái niệm phản ánh cấu trúc của thông tin sẽ được lưu giữ trong cơ sở dữ liệu. Một cách tiếp cận phổ cập cho việc này là tăng trưởng một quy mô quan hệ thực thể, thường với sự trợ giúp của những công cụ vẽ. Một cách tiếp cận thông dụng khác là Ngôn ngữ quy mô thống nhất. Một quy mô dữ liệu thành công xuất sắc sẽ phản ánh đúng mực trạng thái hoàn toàn có thể có của quốc tế bên ngoài đang được quy mô hóa : ví dụ : nếu mọi người hoàn toàn có thể có nhiều hơn 1 số ít điện thoại thông minh, nó sẽ được cho phép chớp lấy thông tin này. Thiết kế một quy mô dữ liệu khái niệm tốt yên cầu sự hiểu biết tốt về miền ứng dụng ; nó thường tương quan đến việc đặt câu hỏi thâm thúy về những điều mà một tổ chức triển khai chăm sóc, như ” người mua cũng hoàn toàn có thể là nhà cung ứng không ? ” hoặc ” nếu một loại sản phẩm được bán với hai hình thức đóng gói khác nhau, đó là cùng một loại sản phẩm hay mẫu sản phẩm khác nhau ? ” hoặc ” nếu một chiếc máy bay bay từ Thành Phố New York đến Dubai qua Frankfurt, đó có phải là một hoặc hai chuyến bay ( hoặc thậm chí còn là ba ) không ? “. Các câu vấn đáp cho những câu hỏi này thiết lập những định nghĩa về thuật ngữ được sử dụng cho những thực thể ( người mua, loại sản phẩm, chuyến bay, phân khúc chuyến bay ) và những mối quan hệ và thuộc tính của chúng .Sản xuất quy mô dữ liệu khái niệm đôi lúc tương quan đến nguồn vào từ những quá trình kinh doanh thương mại hoặc nghiên cứu và phân tích quá trình việc làm trong tổ chức triển khai. Điều này hoàn toàn có thể giúp thiết lập những thông tin thiết yếu trong cơ sở dữ liệu và những gì hoàn toàn có thể bị bỏ lại. Ví dụ, nó hoàn toàn có thể giúp khi quyết định liệu cơ sở dữ liệu có cần giữ dữ liệu lịch sử dân tộc cũng như dữ liệu hiện tại hay không .

Đã tạo ra một mô hình dữ liệu khái niệm mà người dùng hài lòng, giai đoạn tiếp theo là dịch nó thành một lược đồ thực hiện các cấu trúc dữ liệu có liên quan trong cơ sở dữ liệu. Quá trình này thường được gọi là thiết kế cơ sở dữ liệu logic và đầu ra là một mô hình dữ liệu lôgic được thể hiện dưới dạng lược đồ. Trong khi mô hình dữ liệu khái niệm (về lý thuyết ít nhất) không phụ thuộc vào sự lựa chọn công nghệ cơ sở dữ liệu, mô hình dữ liệu lôgic sẽ được biểu thị theo mô hình cơ sở dữ liệu cụ thể được DBMS chọn. (Mô hình dữ liệu thuật ngữ và mô hình cơ sở dữ liệu thường được sử dụng thay thế cho nhau, nhưng trong bài viết này, chúng tôi sử dụng mô hình dữ liệu để thiết kế cơ sở dữ liệu cụ thể và mô hình cơ sở dữ liệu cho ký hiệu mô hình được sử dụng để thể hiện thiết kế đó.)

Mô hình cơ sở dữ liệu thông dụng nhất cho cơ sở dữ liệu đa năng là quy mô quan hệ, hay đúng chuẩn hơn là quy mô quan hệ được bộc lộ bằng ngôn từ SQL. Quá trình tạo ra một phong cách thiết kế cơ sở dữ liệu logic bằng quy mô này sử dụng một chiêu thức có chiêu thức được gọi là chuẩn hóa. Mục tiêu của chuẩn hóa là bảo vệ rằng mỗi ” thực tiễn ” cơ bản chỉ được ghi lại ở một nơi, để những phần chèn, update và xóa tự động hóa duy trì tính đồng nhất .

Giai đoạn cuối cùng của thiết kế cơ sở dữ liệu là đưa ra các quyết định ảnh hưởng đến hiệu suất, khả năng mở rộng, phục hồi, bảo mật và tương tự, phụ thuộc vào DBMS cụ thể. Điều này thường được gọi là thiết kế cơ sở dữ liệu vật lý và đầu ra là mô hình dữ liệu vật lý. Mục tiêu chính trong giai đoạn này là tính độc lập dữ liệu, nghĩa là các quyết định được đưa ra cho mục đích tối ưu hóa hiệu suất sẽ vô hình đối với người dùng cuối và ứng dụng. Có hai loại độc lập dữ liệu: độc lập dữ liệu vật lý và độc lập dữ liệu logic. Thiết kế vật lý được điều khiển chủ yếu bởi các yêu cầu về hiệu suất và đòi hỏi kiến thức tốt về khối lượng công việc và các mẫu truy cập dự kiến và hiểu biết sâu sắc về các tính năng được cung cấp bởi DBMS đã chọn.

Một góc nhìn khác của phong cách thiết kế cơ sở dữ liệu vật lý là bảo mật thông tin. Nó gồm có cả việc xác lập trấn áp truy vấn cho những đối tượng người tiêu dùng cơ sở dữ liệu cũng như xác lập những mức và phương pháp bảo mật thông tin cho chính dữ liệu .
Cắt dán năm loại mô hình cơ sở dữ liệu
Mô hình cơ sở dữ liệu là một loại quy mô dữ liệu xác lập cấu trúc logic của cơ sở dữ liệu và xác lập cơ bản theo phương pháp dữ liệu hoàn toàn có thể được tàng trữ, sắp xếp và thao tác. Ví dụ phổ cập nhất của quy mô cơ sở dữ liệu là quy mô quan hệ ( hoặc xê dịch SQL của quan hệ ), sử dụng định dạng dựa trên bảng .Các quy mô dữ liệu logic phổ cập cho cơ sở dữ liệu gồm có :

  • Cơ sở dữ liệu hướng đối tượng
    • Mô hình cơ sở dữ liệu phân cấp
    • Mô hình mạng
    • Cơ sở dữ liệu đồ thị
  • Mô hình quan hệ
  • Mô hình quan hệ Entity
    • Mô hình quan hệ thực thể nâng cao
  • Mô hình đối tượng
  • Mô hình tài liệu
  • Mô hình giá trị thuộc tính Entity
  • Lược đồ sao

Một cơ sở dữ liệu quan hệ đối tượng người tiêu dùng tích hợp hai cấu trúc tương quan .Các quy mô dữ liệu vật lý gồm có :

  • Chỉ số đảo ngược
  • Tập tin phẳng

Các quy mô khác gồm có :

  • Mô hình liên kết
  • Mô hình đa chiều
  • Mô hình mảng
  • Mô hình đa giá trị

Các quy mô chuyên biệt được tối ưu hóa cho những loại dữ liệu đơn cử :

  • Cơ sở dữ liệu XML
  • Mô hình ngữ nghĩa
  • Cửa hàng nội dung
  • Cửa hàng sự kiện
  • Mô hình chuỗi thời gian

Cấp độ xem bên ngoài, khái niệm và nội bộ[sửa|sửa mã nguồn]

Chế độ xem dữ liệu truyền thống [28]
Một mạng lưới hệ thống quản trị cơ sở dữ liệu cung ứng ba khung nhìn của dữ liệu cơ sở dữ liệu :

  • Cấp độ bên ngoài xác định cách mỗi nhóm người dùng cuối nhìn thấy tổ chức dữ liệu trong cơ sở dữ liệu. Một cơ sở dữ liệu có thể có bất kỳ số lượt xem nào ở cấp độ bên ngoài.
  • Mức khái niệm thống nhất các quan điểm bên ngoài khác nhau thành một chế độ xem toàn cầu tương thích. Nó cung cấp tổng hợp của tất cả các cấp độ xem bên ngoài. Nó nằm ngoài phạm vi của những người dùng cuối cơ sở dữ liệu khác nhau và được các nhà phát triển ứng dụng cơ sở dữ liệu và quản trị viên cơ sở dữ liệu quan tâm.
  • Cấp độ nội bộ (hoặc cấp độ vật lý) là tổ chức nội bộ của dữ liệu bên trong DBMS. Nó liên quan đến chi phí, hiệu suất, khả năng mở rộng và các vấn đề hoạt động khác. Nó liên quan đến bố trí lưu trữ dữ liệu, sử dụng các cấu trúc lưu trữ như chỉ mục để nâng cao hiệu suất. Đôi khi, nó lưu trữ dữ liệu của các chế độ xem riêng lẻ (chế độ xem được cụ thể hóa), được tính toán từ dữ liệu chung, nếu có sự biện minh về hiệu suất cho sự dư thừa đó. Nó cân bằng tất cả các yêu cầu về hiệu suất của các khung nhìn bên ngoài, có thể xung đột, trong nỗ lực tối ưu hóa hiệu suất tổng thể trên tất cả các hoạt động.

Mặc dù thường chỉ có một chế độ xem khái niệm (hoặc logic) và vật lý (hoặc nội bộ) của dữ liệu, có thể có bất kỳ số lượt xem bên ngoài khác nhau. Điều này cho phép người dùng xem thông tin cơ sở dữ liệu theo cách liên quan đến kinh doanh hơn là từ quan điểm xử lý kỹ thuật. Ví dụ: bộ phận tài chính của một công ty cần chi tiết thanh toán của tất cả nhân viên như một phần chi phí của công ty, nhưng không cần chi tiết về nhân viên là mối quan tâm của bộ phận nhân sự. Do đó, các bộ phận khác nhau cần quan điểm khác nhau về cơ sở dữ liệu của công ty.

Kiến trúc cơ sở dữ liệu ba cấp liên quan đến khái niệm độc lập dữ liệu, một trong những động lực ban đầu chính của mô hình quan hệ. Ý tưởng là những thay đổi được thực hiện ở một mức độ nhất định không ảnh hưởng đến chế độ xem ở cấp độ cao hơn. Ví dụ, các thay đổi ở cấp độ nội bộ không ảnh hưởng đến các chương trình ứng dụng được viết bằng giao diện cấp khái niệm, điều này làm giảm tác động của việc thực hiện các thay đổi vật lý để cải thiện hiệu suất.

Khung nhìn khái niệm cung ứng một mức độ gián tiếp giữa bên trong và bên ngoài. Một mặt, nó cung ứng một khung nhìn chung cho cơ sở dữ liệu, độc lập với những cấu trúc khung nhìn bên ngoài khác nhau và mặt khác, nó trừu tượng hóa những cụ thể về cách dữ liệu được tàng trữ hoặc quản trị ( mức nội bộ ). Về nguyên tắc, mọi Lever và thậm chí còn mọi chính sách xem bên ngoài đều hoàn toàn có thể được trình diễn bởi một quy mô dữ liệu khác nhau. Trong thực tiễn, một DBMS nhất định sử dụng cùng một quy mô dữ liệu cho cả mức độ bên ngoài và mức khái niệm ( ví dụ : quy mô quan hệ ). Cấp độ bên trong, được ẩn bên trong DBMS và phụ thuộc vào vào việc tiến hành nó, yên cầu một mức độ cụ thể khác và sử dụng những loại cấu trúc dữ liệu riêng của nó .

Tách rời các cấp độ bên ngoài, khái niệmbên trong là một tính năng chính của việc triển khai mô hình cơ sở dữ liệu quan hệ thống trị cơ sở dữ liệu thế kỷ 21.

Công nghệ cơ sở dữ liệu là một chủ đề điều tra và nghiên cứu tích cực từ những năm 1960, cả trong những học viện chuyên nghành và trong những nhóm điều tra và nghiên cứu và tăng trưởng của những công ty ( ví dụ như Nghiên cứu của IBM ). Hoạt động nghiên cứu và điều tra gồm có kim chỉ nan và tăng trưởng những nguyên mẫu. Các chủ đề điều tra và nghiên cứu đáng chú ý quan tâm đã gồm có những quy mô, khái niệm thanh toán giao dịch nguyên tử và những kỹ thuật trấn áp đồng thời có tương quan, ngôn từ truy vấn và giải pháp tối ưu hóa truy vấn, RAID, v.v… .

Khu vực nghiên cứu cơ sở dữ liệu có một số tạp chí học thuật chuyên dụng (ví dụ: ACM Transactions on Database Systems -TODS, Data & Knowledge Engineering -DKE) và các hội nghị hàng năm (ví dụ: ACM SIGMOD, ACM PODS, VLDB, IEEE ICDE).

  1. ^ This article quotes a development time of 5 years involving 750 people for DB2 release 9 alone. ( Chong và đồng nghiệp 2007

Sách tìm hiểu thêm[sửa|sửa mã nguồn]

Cơ sở dữ liệu – Wikipedia tiếng Việt

Bài viết liên quan
Hotline 24/7: O984.666.352
Alternate Text Gọi ngay