IT story

테이블의 기본 키에 대한 모범 사례는 무엇입니까?

hot-time 2020. 4. 9. 08:10
반응형

테이블의 기본 키에 대한 모범 사례는 무엇입니까?


테이블을 디자인 할 때 고유 한 하나의 열이 있고 기본 키를 만드는 습관을 개발했습니다. 이는 요구 사항에 따라 세 가지 방식으로 달성됩니다.

  1. 자동 증분되는 ID 정수 열입니다.
  2. 고유 식별자 (GUID)
  3. 행 식별자 열로 사용할 수있는 짧은 문자 (x) 또는 정수 (또는 상대적으로 작은 숫자 유형) 열

숫자 3은 상당히 작은 조회, 주로 고유 한 정적 길이 문자열 코드 또는 1 년 또는 기타 숫자와 같은 숫자 값이있는 테이블을 읽는 데 사용됩니다.

대부분의 다른 모든 테이블에는 자동 증분 정수 또는 고유 식별자 기본 키가 있습니다.

질문 :-)

최근에 일관된 행 식별자가없는 데이터베이스 작업을 시작했으며 기본 키가 현재 다양한 열에 클러스터되어 있습니다. 몇 가지 예 :

  • 날짜 / 문자
  • 날짜 / 정수
  • 날짜 / 시간
  • char / nvarchar / nvarchar

이에 대한 유효한 사례가 있습니까? 이 경우 항상 ID 또는 고유 식별자 열을 정의했을 것입니다.

또한 기본 키가없는 테이블이 많이 있습니다. 이에 대한 유효한 이유는 무엇입니까?

나는 왜 테이블이 원래대로 디자인되었는지 이해하려고하는데, 그것은 나에게 큰 혼란으로 보이지만 그만한 이유가있을 수 있습니다.

답을 해독하는 데 도움이되는 세 번째 질문 : 복합 기본 키를 구성하기 위해 여러 열을 사용하는 경우이 방법과 대리 / 인공 키 사이에 특별한 이점이 있습니까? 나는 주로 성능, 유지 관리, 관리 등과 관련하여 생각하고 있습니까?


몇 가지 규칙을 따릅니다.

  1. 기본 키는 필요한만큼 작아야합니다. 숫자 형식은 문자 형식보다 훨씬 컴팩트 한 형식으로 저장되므로 숫자 형식을 선호하십시오. 이는 대부분의 기본 키가 다른 테이블의 외래 키일뿐 아니라 여러 인덱스에 사용되기 때문입니다. 키가 작을수록 인덱스가 작을수록 사용할 캐시의 페이지 수가 줄어 듭니다.
  2. 기본 키는 절대 바뀌지 않아야합니다. 기본 키 업데이트는 항상 문제가되지 않아야합니다. 여러 인덱스에서 사용되어 외래 키로 사용될 가능성이 높기 때문입니다. 단일 기본 키를 업데이트하면 변경으로 인한 파급 효과가 발생할 수 있습니다.
  3. "문제 기본 키"를 논리 모델 기본 키로 사용하지 마십시오. 예를 들어 여권 번호, 주민등록 번호 또는 직원 계약 번호는 이러한 "기본 키"는 실제 상황에 따라 변경 될 수 있습니다.

대리 키와 자연 키에 대해서는 위의 규칙을 참조하십시오. 자연 키가 작고 변경되지 않으면 기본 키로 사용될 수 있습니다. 자연 키가 크거나 변경 될 가능성이있는 경우 대리 키를 사용합니다. 기본 키가없는 경우 경험에 따르면 항상 스키마에 테이블을 추가하고 기본 키를 배치하기를 원하므로 대리 키를 만듭니다.


자연 구절 인공 열쇠는 데이터베이스 커뮤니티 사이에서 일종의 종교적인 논쟁입니다. 이 기사 와 관련 기사를 참조하십시오 . 나는 항상 인공적인 열쇠를 갖는 것을 좋아하지 않으며 결코 그것을 갖지 않는 것도 좋아하지 않습니다 . 예를 들어 사례별로 결정합니다.

  • 미국 : 텍사스의 경우 state_id = 1 대신 state_code (텍사스의 경우 'TX'등)로 이동합니다.
  • 직원 : 나는 일반적으로 다른 것으로 보이는 것을 찾기가 어렵 기 때문에 가상의 employee_id를 만듭니다. SSN 또는 이와 동등한 기능이 작동 할 수 있지만 아직 SSN을 제공하지 않은 새로운 조인과 같은 문제가있을 수 있습니다.
  • 직원 급여 내역 : (employee_id, start_date). 나는 할 수 없습니다 인공 employee_salary_history_id을 만들 수 있습니다. 어떤 시점에 도움이됩니까 ( "어리 석음 일관성" 이외 )

인공 키가 사용되는 곳마다 항상 자연 키에 대한 고유 제한 조건을 선언해야합니다. 예를 들어, 필요한 경우 state_id를 사용하지만 state_code에 고유 제한 조건을 선언하는 것이 좋습니다. 그렇지 않으면 결국 다음과 같이 끝납니다.

state_id    state_code   state_name
137         TX           Texas
...         ...          ...
249         TX           Texas

종종 간과되는 내용에 대한 추가 의견. 때로는 대리 키를 사용하지 않으면 자식 테이블에 이점이 있습니다. 하나의 데이터베이스 내에서 여러 회사를 운영 할 수있는 디자인이 있다고 가정 해 봅시다 (호스팅 된 솔루션 등).

이 테이블과 열이 있다고 가정 해 봅시다.

Company:
  CompanyId   (primary key)

CostCenter:
  CompanyId   (primary key, foreign key to Company)
  CostCentre  (primary key)

CostElement
  CompanyId   (primary key, foreign key to Company)
  CostElement (primary key)

Invoice:
  InvoiceId    (primary key)
  CompanyId    (primary key, in foreign key to CostCentre, in foreign key to CostElement)
  CostCentre   (in foreign key to CostCentre)
  CostElement  (in foreign key to CostElement)

마지막 비트가 의미가없는 경우 Invoice.CompanyId하나는 CostCentre 테이블에 대한 하나와 CostElement 테이블 에 대한 두 개의 외래 키의 일부입니다 . 기본 키는 ( InvoiceId , CompanyId )입니다.

이 모델에서는 한 회사 CostElement다른 회사 CostCentre 를 고정하고 참조 할 수 없습니다 . CostElementCostCentre 테이블 에 서로 게이트 키가 사용 된 경우 해당 키가 사용됩니다 .

망칠 확률이 적을수록 좋습니다.


인간의 실수라는 단순한 이유로 자연 키를 사용하지 마십시오. 고유 한 고유 식별자 (SSN, VIN, 계좌 번호 등)를 사용할 수 있지만 사람이 올바르게 입력해야합니다. SSN을 기본 키로 사용하는 경우 누군가 데이터를 입력하는 동안 몇 개의 숫자를 바꾸고 오류가 즉시 발견되지 않으면 기본 키를 변경해야합니다.

내 기본 키는 모두 백그라운드에서 데이터베이스 프로그램에 의해 처리되며 사용자는이를 알지 못합니다.


다양한 필드에서 기본 키를 만드는 데 아무런 문제가 없습니다 . 즉, 자연 키 입니다.

후보 필드의 고유 색인과 연관된 ID 열을 사용하여 대리 키 를 작성할 수 있습니다.

그것은 오래된 토론입니다. 대부분의 상황에서 대리 키를 선호합니다.

그러나 열쇠가 부족하다는 변명은 없습니다.

재 : 편집

예, 그것에 대해 많은 논쟁이 있습니다 : D

나는 자연 키가 자연 선택이라는 사실 외에도 자연 키에 명백한 이점을 보지 못합니다. 당신은 항상 생각합니다 이름, SocialNumber - 또는 그런 일 - 대신 idPerson .

대리 키는 자연 키의 몇 가지 문제에 대한 해답입니다 (예 : 변경 사항 전파).

대리하기에 익숙해지면 더 깨끗하고 관리하기 쉬워 보입니다.

그러나 결국, 그것은 맛의 문제 또는 사고 방식이라는 것을 알게 될 것입니다. 사람들은 자연적인 열쇠로 "더 잘 생각한다".


테이블에는 항상 기본 키가 있어야합니다. 그렇지 않은 경우 자동 증가 필드 여야합니다.

때때로 사람들은 많은 양의 데이터를 전송하기 때문에 기본 키를 생략하고 프로세스에 따라 속도가 느려질 수 있습니다 (데이터베이스에 따라 다름). 그러나 그 후에 추가해야합니다.

link table에 대한 한 가지 의견 , 맞습니다. 그러나 예외를 유지하기 위해 FK 필드는 예외입니다. 그러나 링크에서 중복이 인증되지 않은 경우 해당 필드도 기본 키가 될 수 있습니다 ... 예외는 프로그래밍에서 종종 예외이기 때문에 데이터의 무결성을 유지하려면 기본 키가 있어야합니다.


모든 좋은 답변 외에도 방금 읽은 좋은 기사 인 The Greater Key-Key 토론 을 공유하고 싶습니다 .

몇 가지 요점을 인용하면 다음과 같습니다.

개발자는 각 테이블의 기본 키를 선택할 때 몇 가지 규칙을 적용해야합니다.

  • 기본 키는 각 레코드를 고유하게 식별해야합니다.
  • 레코드의 기본 키 값은 null 일 수 없습니다.
  • 레코드가 작성 될 때 기본 키-값이 존재해야합니다.
  • 기본 키는 안정적으로 유지되어야합니다. 기본 키 필드는 변경할 수 없습니다.
  • 기본 키는 크기가 작아야하며 가능한 가장 적은 속성을 포함해야합니다.
  • 기본 키 값은 변경할 수 없습니다.

자연 키는 규칙을 어기는 경향이 있습니다. 서로 게이트 키는 규칙을 준수합니다. (이 기사를 더 잘 읽으면 시간 가치가 있습니다!)


기본 키의 특별한 점은 무엇입니까?

스키마에서 테이블의 목적은 무엇입니까? 테이블 키의 목적은 무엇입니까? 기본 키의 특별한 점은 무엇입니까? 기본 키에 대한 논의는 기본 키가 테이블의 일부이고 해당 테이블이 스키마의 일부라는 점을 놓친 것 같습니다. 테이블 및 테이블 관계에 가장 적합한 것은 사용되는 키를 구동해야합니다.

테이블 (및 테이블 관계)에는 기록하려는 정보에 대한 사실이 포함됩니다. 이러한 사실은 독립적이며 의미 있고 이해하기 쉽고 모순되지 않아야합니다. 디자인 관점에서 스키마에서 추가 또는 제거 된 다른 테이블은 해당 테이블에 영향을 미치지 않아야합니다. 정보 자체에만 관련된 데이터를 저장하기위한 목적이 있어야합니다. 테이블에 저장된 내용을 이해하는 것은 과학적 연구 프로젝트를 수행 할 필요가 없습니다. 같은 목적으로 저장된 사실은 두 번 이상 저장해서는 안됩니다. 키는 기록되는 정보의 전체 또는 일부이며 고유하며 기본 키는 테이블에 대한 기본 액세스 지점이되도록 특별히 지정된 키입니다 (예 : 삽입이 아니라 데이터 일관성 및 사용을 위해 선택해야 함) 공연).

  • ASIDE : 불행히도 응용 프로그램 프로그래머가 설계하고 개발하는 대부분의 데이터베이스의 부작용은 (때로는 응용 프로그램 또는 응용 프로그램 프레임 워크에 가장 적합한 것이 종종 테이블의 기본 키 선택을 주도한다는 것입니다. 이로 인해 정수 및 GUID 키 (응용 프로그램 프레임 워크에 사용하기 간단 함)와 모 놀리 식 테이블 디자인 (메모리의 데이터를 나타내는 데 필요한 응용 프로그램 프레임 워크 개체 수가 감소됨)이 발생합니다. 이러한 응용 프로그램 중심의 데이터베이스 디자인 결정은 대규모로 사용될 때 중대한 데이터 일관성 문제를 야기합니다. 이러한 방식으로 설계된 응용 프로그램 프레임 워크는 자연스럽게 한 번에 테이블 디자인으로 이어집니다. “부분 레코드”는 시간이 지남에 따라 채워진 테이블 및 데이터에 작성됩니다. 다중 테이블 상호 작용을 피하거나 사용하면 응용 프로그램이 제대로 작동하지 않을 때 데이터가 일치하지 않습니다. 이러한 디자인은 의미가없는 (또는 이해하기 어려운) 데이터, 테이블에 분산 된 데이터 (현재 테이블을 이해하기 위해 다른 테이블을 살펴 봐야 함) 및 중복 된 데이터로 이어집니다.

기본 키는 필요한만큼 작아야한다고합니다. 키는 필요한만큼만 커야한다고 말합니다. 의미없는 필드를 테이블에 임의로 추가하는 것은 피해야합니다. 임의로 추가 된 무의미한 필드에서 키를 만드는 것이 특히 나쁩니다. 특히 다른 테이블에서 기본이 아닌 키로의 조인 종속성을 제거 할 때 더욱 그렇습니다. 이는 테이블에 좋은 후보 키가없는 경우에만 합리적이지만 모든 테이블에 사용되는 경우 스키마 디자인이 잘못되었음을 나타냅니다.

또한 기본 키를 업데이트하면 항상 문제가 없어야하므로 기본 키는 절대 바뀌지 않아야한다고합니다. 그러나 업데이트는 삭제 후 삽입과 동일합니다. 이 논리에 의해 하나의 키가있는 테이블에서 레코드를 삭제 한 다음 두 번째 키가있는 다른 레코드를 추가해서는 안됩니다. 서로 게이트 기본 키를 추가해도 테이블의 다른 키가 존재한다는 사실은 제거되지 않습니다. 기본 테이블이 아닌 키를 업데이트하면 다른 테이블이 서로 게이트 키를 통해 해당 의미에 종속되는 경우 (예 : 상태 설명이 '처리됨'에서 '취소됨'으로 변경되는 서로 게이트 키가있는 상태 테이블) 데이터의 의미가 손상 될 수 있습니다. '데이터를 손상시킬 수 있습니다). 항상 의문의 여지가없는 것은 데이터의 의미를 파괴하는 것입니다.

이것을 말하면서, 나는 오늘날 비즈니스에 존재하는 제대로 설계되지 않은 많은 데이터베이스 (무의미한 대리 키 데이터 손상-1NF 거대 함)에 대해 감사드립니다. 왜냐하면 적절한 데이터베이스 디자인을 이해하는 사람들에게는 끝없는 양의 작업이 있기 때문입니다. . 그러나 슬픈 측면에서 때로는 시시 푸스처럼 느껴지지만 (충돌 전) 그는 401k의 지옥을 가지고 있다고 확신합니다. 중요한 데이터베이스 디자인 관련 질문은 블로그 및 웹 사이트에서 멀리하십시오. 데이터베이스를 디자인하는 경우 CJ Date를 찾으십시오. Celko를 SQL Server 용으로 참조 할 수 있지만 코를 먼저 잡고 있어야합니다. Oracle 측에서는 Tom Kyte를 참조하십시오.


가능한 경우 자연 키가 가장 좋습니다. 따라서 datetime / char 가 행을 고유하게 식별하고 두 부분이 행에 의미가 있다면 훌륭합니다.

날짜 시간 만 의미가 있고 문자를 독특하게 만들기 위해 방금 고정 된 경우 식별 필드를 사용할 수도 있습니다.


자연스럽고 인공적인 키는 데이터베이스에서 원하는 비즈니스 로직의 양에 달려 있습니다. 사회 보장 번호 (SSN)가 좋은 예입니다.

"데이터베이스의 각 클라이언트에는 SSN이 있어야합니다." Bam, 기본 키로 만들고 완료하십시오. 비즈니스 규칙이 언제 불타는 지 기억하십시오.

나는 비즈니스 규칙을 변경 한 경험으로 인해 자연스러운 키를 좋아하지 않습니다. 그러나 변경되지 않을 것이라고 확신하는 경우 몇 가지 중요한 조인을 막을 수 있습니다.


Steven A. Lowe의 롤업 신문 치료가 원래 데이터 구조의 설계자에게 필요하다고 생각합니다.

제쳐두고, GUID가 기본 키가 성능 돼지 일 수있다. 나는 그것을 추천하지 않을 것입니다.


여러 필드로 구성된 '복합'또는 '복합'기본 키를 사용해야합니다.

이것은 완벽하게 수용 가능한 솔루션 입니다. 자세한 정보 여기이동 하십시오. :)


나도 항상 숫자 ID 열을 사용합니다. 오라클에서는 number (12,0) 이상의 실제 이유없이 숫자 (18,0)를 사용합니다 (또는 long이 아닌 int가 무엇이든), 아마도 몇 억 행을 얻는 것에 대해 걱정하고 싶지 않을 것입니다. db!

또한 기본 추적을 위해 생성되고 수정 된 열 (유형 타임 스탬프)도 포함되어 있습니다.

다른 열 조합에 대해 고유 한 제약 조건을 설정하는 것은 중요하지 않지만 ID가 생성되고 수정 된 기준 요구 사항을 정말로 좋아합니다.


자연스러운 기본 키를 찾아서 가능한 한 사용합니다.

자연 키를 찾을 수 없으면 SQL Server가 트리를 사용하기 때문에 INT ++보다 GUID를 선호하며 트리의 끝에 항상 키를 추가하는 것은 좋지 않습니다.

다 대다 커플 링 인 테이블에서는 외래 키의 복합 기본 키를 사용합니다.

SQL Server를 사용할만큼 운이 좋기 때문에 프로파일 러 및 쿼리 분석기를 사용하여 실행 계획 및 통계를 연구하고 키의 성능을 쉽게 확인할 수 있습니다.


다음은 25 년 이상의 개발 경험을 바탕으로 정한 본인의 경험 규칙입니다.

  • 모든 테이블에는 자동 증분되는 단일 열 기본 키가 있어야합니다.
  • 업데이트 할 수있는보기에 포함하십시오
  • 기본 키는 응용 프로그램과 관련하여 의미가 없어야합니다. 즉, SKU, 계좌 번호 또는 직원 ID 또는 응용 프로그램에 중요한 기타 정보가 아니어야합니다. 엔터티와 관련된 고유 키일뿐입니다.

기본 키는 최적화 목적으로 데이터베이스에서 사용되며 특정 엔터티를 식별하거나 특정 엔터티와 관련된 것 이상으로 응용 프로그램에서 사용해서는 안됩니다.

항상 단일 값 기본 키를 사용하면 UPSERT를 매우 간단하게 수행 할 수 있습니다.

응용 프로그램에서 의미가있는 다중 열 키를 지원하려면 추가 색인을 사용하십시오.


항상 자동 번호 또는 ID 필드를 사용합니다.

SSN을 기본 키로 사용한 클라이언트에서 근무한 후 HIPAA 규정으로 인해 "MemberID"로 변경되어 관련 테이블에서 외래 키를 업데이트 할 때 많은 문제가 발생했습니다. 일관된 ID 열 표준을 고수함으로써 모든 프로젝트에서 비슷한 문제를 피할 수있었습니다.


모든 테이블 에는 기본 키 있어야합니다. 그렇지 않으면, 당신이 가진 것은 HEAP입니다-이것은 어떤 상황에서, 당신이 원하는 것일 수 있습니다 (데이터가 서비스 브로커를 통해 다른 데이터베이스 또는 테이블에 복제 될 때 무거운 삽입로드).

행 수가 적은 룩업 테이블의 경우 3 CHAR 코드를 기본 키로 사용할 수 있습니다.이 키는 INT보다 적은 공간을 차지하지만 성능 차이는 무시할 수 있습니다. 그 외에는 관련 테이블의 외래 키로 구성된 복합 기본 키가있는 참조 테이블이 없으면 항상 INT를 사용합니다.


이 오래된 토론에 대한 모든 내용을 읽고 싶다면 Stack Overflow에서 "natural key"를 검색하십시오. 결과 페이지를 다시 가져와야합니다.


GUID 를 기본 키로 사용할 수 있지만 제대로 작동하려면 올바른 유형의 GUID를 만들어야합니다.

COMB GUID를 생성해야합니다. 이에 대한 좋은 기사와 성능 통계는 기본 키로서의 GUID 비용입니다 .

또한 SQL 에서 COMB GUID 작성에 대한 일부 코드 Uniqueidentifier vs identity ( 아카이브 )에 있습니다.


우리는 많은 조인을 수행하고 복합 기본 키는 성능을 향상시킵니다. 간단한 int 또는 long은 두 번째 후보 키를 도입하더라도 많은 문제를 처리하지만 한 필드에서 세 개의 필드로 결합하는 것이 훨씬 쉽고 이해하기 쉽습니다.


자연 키에 대한 선호도에 대해 먼저 설명하겠습니다. 데이터베이스 관리를 훨씬 쉽게 수행 할 수 있도록 가능한 경우 키를 사용하십시오. 회사에서 모든 테이블에 다음 열이 있다는 표준을 설정했습니다.

  • 행 ID (GUID)
  • 작성자 (문자열, 현재 사용자 이름의 기본값이 있음 ( SUSER_SNAME()T-SQL))
  • 작성 (DateTime)
  • 타임 스탬프

행 ID는 테이블마다 고유 한 키를 가지고 있으며, 모든 경우에 행마다 자동 생성되며 (권한은 누구나 편집 할 수 없음) 모든 테이블과 데이터베이스에서 고유하게 보장됩니다. ORM 시스템에 단일 ID 키가 필요한 경우 이것이 사용됩니다.

한편, 실제 PK는 가능하면 자연스러운 열쇠입니다. 내 내부 규칙은 다음과 같습니다.

  • 사람-대리 키를 사용하십시오 (예 : INT). 내부에있는 경우 Active Directory 사용자 GUID를 사용할 수 있습니다.
  • 조회 테이블 (예 : StatusCodes)-짧은 CHAR 코드를 사용하십시오. INT보다 기억하기가 더 쉬우 며, 대부분의 경우 종이 양식과 사용자는 간결성을 위해이를 사용합니다 (예 : "만료 됨"의 상태 = "E", "승인 됨"의 경우 "A", "석면 없음"의 경우 "NADIS" 샘플에서 ")
  • 테이블을 연결 - FKS의 조합 (예를 들어 EventId, AttendeeId)

따라서 이상적으로는 사람이 읽을 수 있고 자연스럽게 읽을 수있는 PK와 ORM 친화적 인 테이블 당 GUID를 사용하는 것이 이상적입니다.

주의 사항 : 내가 유지 관리하는 데이터베이스는 수백만 또는 수십억이 아닌 100,000의 레코드에 경향이 있으므로 조언을 금하는 더 큰 시스템에 대한 경험이 있다면 저를 무시하십시오!

참고 URL : https://stackoverflow.com/questions/337503/whats-the-best-practice-for-primary-keys-in-tables

반응형