현인

6장 데이터 타입 본문

기술 학습/JavaScript

6장 데이터 타입

현인(Hyeon In) 2023. 6. 12. 18:58

6장 데이터 타입

데이터 타입은 값의 종류를 말한다. 자바스크립트의 모든 값은 데이터 타입을 가지며 ES6 기준 7개의 데이터 타입을 제공한다. 7개의 데이터 타입은 원시 타입과 객체 타입으로 분류할 수 있다.

구분 데이터 타입 설명
원시 타입 숫자(number) 타입 숫자. 정수와 실수 구분 없이 하나의 숫자 타입만 존재
문자열(string) 타입 문자열
불리언(boolean) 타입 논리적 참(true)과 거짓(false)
undefined 타입 var 키워드로 선언된 변수에 암묵적으로 할당되는 값
null 타입 값이 없다는 것을 의도적으로 명시할 때 사용하는 값
심벌(symbol) 타입 ES6에서 추가된 7번째 타입
객체 타입 객체, 함수, 배열 등

타입에 따라 확보해야할 메모리 공간의 크기도 다르고 메모리에 저장되는 2진수도 다르며 읽어 들여 해석하는 방식도 다르다. 이처럼 개발자는 명확한 의도를 가지고 타입을 구별해서 값을 생성할 것이고, 자바스크립트 엔진은 타입을 구별해서 값을 취급할 것이다.

숫자 타입

C, Java 의 경우 정수와 실수를 구분해서 다양한 숫자 타입을 제공하지만 자바스크립트는 독특하게 하나의 숫자 타입만 존재한다.

ECMAScript 사양에 따르면 숫자 타입의 값은 배정밀도 64비트 부동소수점 형식을 따른다. 따라서 모든 수를 실수로 처리하며 정수만 포현하기 위한 타입이 별도로 존재하지 않는다. 정수, 실수, 2진수, 8진수, 16진수 리터럴은 모두 메모리에 배정밀도 64비트 부동소수점 형식의 2진수로 저장된다. 

var binary = 0b01000001; // 2진수
var octal = 0o101; // 8진수
var hex = 0x41; // 16진수

consol.log(binary); // 65
consol.log(octal); // 65
consol.log(hex); // 65
console.log(binary === octal) // true
console.log(hex === octal) // true

자바스크립트는 2진수, 8진수, 16진수를 표현하기 위한 데이터 타입을 제공하지 않기 때문에 이 값들은 참조하면 모두 10진수로 해석된다.

모든 수를 실수로 처리하기 때문에 정수끼리 나누더라도 실수가 나올 수 있다.

숫자 타입은 추가적으로 세 가지 특별한 값도 표현할 수 있다.

  • Infinity : 양의 무한대
  • -Infinity : 음의 무한대
  • NaN : 산술 연산 불가 (Not-a-number)

자바스크립트는 대소문자를 구별하므로 NaN을 NAN, nan, Nan 처럼 표현하면 에러가 발생하므로 주의할 것

문자열 타입

문자열 타입은 텍스트 데이터를 나타내는 데 사용한다. 문자열은 0개 이상의 16비트 유니코드 문자(UTF-16)의 집합으로 전 세계 대부분의 문자를 표현할 수 있다.

문자열은 작은 따옴표(''), 큰 따옴표("") 또는 백틱(``)으로 텍스트를 감싼다. 가장 일반적인 표기법은 작은따옴표를 사용하는 것이다.

문자열을 따옴표로 감싸는 이유는 키워드나 식별자 같은 토큰과 구분하기 위해서다. 또 스페이스와 같은 공백 문자도 포함시킬 수 없다.

C는 문자열 타입을 제공하지 않고 문자의 배열로 문자열을 표현하고, 자바는 문자열을 객체로 표현한다. 그러나 자바스크립트의 문자열은 원시 타입이며 변경 불가능한(immutable) 값이다. 

템플릿 리터럴

ES6부터 템플릿 리터럴이라고 하는 새로운 문자열 표기법이 도입되었다. 멀티라인 문자열, 표현식 삽입, 태그드 템플릿(tagged template) 등 편리한 문자열 처리 기능을 제공한다. 템플릿 리터럴은 런타임에 일반 문자열로 변환되어 처리된다.

일반 문자열과 비슷해 보이지만 백틱(``)을 사용해 표현한다.

멀티라인 문자열

일반 문자열 내에서는 줄바꿈이 허용되지 않는다. 따라서 줄바꿈 등의 공백을 표현하려면 이스케이프 시퀀스를 사용해야한다. (ex 'Hi /n')

일반 문자열과 달리 템플릿 리터럴 내에서는 이스케이프 시퀀스를 사용하지 않고도 줄바꿈이 허용되며, 모든 공백도 있는 그대로 적용된다.

var template = `<ul>
	<li>hi</li>
</ul>`

// 출력 결과
//<ul>
//	<li>hi</li>
//</ul>

표현식 삽입

문자열은 문자열 연산자 +를 활용하여 연결할 수 있다. + 연산자는 피연산자 중 하나 이상이 문자열일 때 문자열 연결 연산자로 동작한다. 그 외의 경우는 덧셈 연산자로 동작한다.

템플릿 리터럴 내에서는 표현식 삽입을 통해 간단히 문자열을 삽입할 수 있다. 이를 통해 문자열 연산자보다 가독성 좋고 간편하게 문자열을 조합할 수 있다.

var first = 'Hyeon In';
var last = 'Choi';

console.log(`My name is ${first} ${last}.`); // My name is Hyeon In Choi.

표현식을 삽입하려면 ${}으로 표현식을 감싼다. 만약 표현식의 평가 결과가 문자열이 아니더라도 문자열로 타입이 강제로 변환되어 삽입된다. 표현식 삽입은 반드시 템플릿 리터럴 내에서 사용해야 한다.

불리언 타입

불리언 타입은 논리적 참, 거짓을 나타내는 true, false 뿐이다.

참과 거짓으로 구분되는 조건에 의해 프로그램의 흐름을 제어하는 조건문에서 자주 사용한다.

undefined 타입

undefined 타입의 값은 undefined가 유일하다.

var 키워드로 선언한 변수를 암묵적으로 undefined로 초기화 하는데, 그 이유는 할당된 메모리 공간에 쓰레기 값을 참조하지 않기 위함이다. 

undefined는 개발자가 의도적으로 할당하기 위한 값이 아니라 자바스크립트 엔진이 변수를 초기화 할 때 사용하는 값이다. 따라서 의도적으로 undefined를 사용하여 의도적으로 변수에 할당하는 것은 본래 취지와 어긋나며 혼란을 줄 수 있으므로 권장하지 않는다

null 타입

null 타입의 값은 null이 유일하다. 자바스크립트는 대소문자를 구별하므로 Null 혹은 NULL과 같이 표기하지 않도록 조심하자

프로그래밍 언어에서 null은 변수에 값이 없다는 것을 의도적으로 명시할 때 사용한다. 변수에 null을 할당하는 것은 변수가 이전에 참조하던 값을 더 이상 참조하지 않겠다는 의미다. null을 할당함으로써 기존의 참조하던 메모리 주소는 누구도 참조하지 않게 된다. 따라서 자바스크립트 엔진은 가비지 콜렉션을 수행할 것이다.

함수가 유효한 값을 반환할 수 없는 경우 명시적으로 null을 반환하기도 한다. 예를 들어 querySelector는 조건에 부합하는 HTML 요소를 검색할 수 없는 경우 에러 대신 null을 반환한다.

심벌 타입 

ES6에서 추가된 7번째 타입으로, 변경 불가능한 원시 타입이다. 심벌 값은 다른 값과 중복되지 않는 유일무이한 값이다. 따라서 주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용한다. 심벌 이외의 원시 값은 리터럴을 통해 생성하지만 심벌은 Symbol 함수를 호출해 생성한다. 이때 생성된 심벌값은 외부에 노출되지 않으며, 다른 값과 절대 중복되지 않는 유일무이한 값이다.

객체 타입

자바스크립트의 데이터 타입은 크게 원시 타입과 객체 타입으로 분류된다. 객체 타입과 원시 타입은 근본적으로 다르다. 해당 내용은 11장에서 자세히 알아본다

중요한 것은 자바스크립트는 객체 기반의 언어이며, 자바스크립트를 이루고 있느 거의 모든 것이 객체라는 것이다. 원시 타입 이외의 모든 값은 모두 객체 타입이다.

데이터 타입의 필요성

가장 중요한 부분이다. 그럼 데이터 타입은 왜 필요할까

데이터 타입에 의한 메모리 공간의 확보와 참조

값은 메모리에 저장하고 참조할 수 있어야 한다. 메모리에 값을 저장하려면 먼저 확보해야 할 메모리 공간의 크기를 결정해야 한다. 자바스크립트 엔진은 데이터 타입, 즉 값의 종류에 따라 정해진 크기의 메모리 공간을 확보한다. 다시 말해, 데이터 타입에 따라 확보해야 할 메모리 공간의 크기가 달라진다.

예를 들어 숫자타입은 배정밀도 64비트 부동소수점 형식을 사용하기에 8바이트의 메모리 공간을 확보한다.

공간의 확보 다음은 메모리 참조다.

식별자를 통해 메모리 공간의 주소를 찾는다. 정확히 말하면 값이 저장되어 있는 메모리 공간의 선두 메모리 셀의 주소를 찾아간다. 이 때 값을 참조하려면 한 번에 읽어 들여야 할 메모리 공간의 크기, 즉 메모리 셀의 개수(바이트 수)를 알아야 한다. 자바스크립트 엔진은 할당되어 있는 값의 타입을 보고 이 개수를 정한다.

컴파일러 또는 인터프리터는 심벌 테이블이라고 부르는 자료 구조를 통해 식별자를 키로 바인딩된 값의 메모리 주소, 데이터 타입, 스코프 등을 관리한다.

데이터 타입에 의한 값의 해석

메모리에서 읽어들일 크기까지 정했다. 그 다음은 어떻게 해석해야 하느냐다.

메모리에 저장된 값은 데이터 타입에 따라 다르게 해석할 수 있다. 예를 들어, 메모리에 저장된 값 0100 0001을 숫자로 해석하면 65지만, 문자열로 해석하면 'A'다.

정리하면,

  • 값을 저장할 때 확보해야 할 메모리 공간의 크기를 결정
  • 값을 참조할 때 한 번에 읽어 들여야 할 메모리 공간의 크기를 결정
  • 메모리에서 읽어 들인 2진수를 어떻게 해석할지 결정

동적 타이핑

동적 타입 언어와 정적 타입 언어

C와 자바 같은 정적 타입 언어는 변수를 선언할 때 변수에 할당할 수 있는 값의 종류, 즉 데이터 타입을 사전에 선언해야 한다. 이를 명시적 타입 선언이라 한다.

정적 타입 언어는 타입을 변경할 수 없으며 변수에 선언한 타입에 맞는 값만 할당할 수 있다. 정적 타입 언어는 컴파일 시점에 타입 체크를 수행한다.이를 통해 타입의 일관성을 강제함으로써 더욱 안정적인 코드의 구현을 통해 런타임에 발생하는 에러를 줄인다.

자바스크립트는 변수를 선언할 때 타입을 선언하지 않는다. 다만 var, let, const 키워드를 사용해 변수를 선언할 뿐이다. 자바스크립트의 변수는 어떠한 데이터 타입의 값이라도 자유롭게 할당할 수 있다.

정적 타입 언어는 변수 선언 시점에 타입이 결정되고 변수의 타입을 변경할 수 없다. 반면, 자바스크립트에서는 값을 할당하는 시점에 타입이 동적으로 결정되고 변수의 타입을 언제든지 자유롭게 변경할 수 있다.

다시 말해, 자바스크립트의 변수는 선언이 아닌 할당에 의해 타입이 결정(타입 추론)된다. 그리고 재할당에 의해 변수의 타입은 언제든지 동적으로 변할 수 있다. 이러한 특징을 동적 타이핑이라하며, 자바스크립트를 정적 타입 언어와 구별하기 위해 동적 타입 언어라 한다.

동적 타입 언어와 변수

동적 타입 언어는 변수에 어떤 데이터 타입의 값이라도 자유롭게 할당할 수 있다. 이러한 동적 타입 언어의 특징은 데이터 타입에 대해 무감각해질 정도로 편리하는 것이다.

변수 값은 언제든지 변경될 수 있기 때문에 복잡한 프로그램에서는 변화하는 변수 값을 추적하기 어려울 수 있다. 그뿐만 아니라 변수의 타입이 고정되어 있지 않고 동적으로 변하는 동적 타입 언어의 변수는 값의 변경에 의해 타입도 언제든지 변경될 수 있다. 따라서 동적 타입 언어의 변수는 값을 확인하기 전에는 타입을 확신할 수 없다.

더욱이 자바스크립트는 개발자의 의도와는 상관없이 암묵적인 타입 변환이 이루어지기도 한다. 즉, 숫자 타입의 변수일 것이라고 예측했지만 실제로는 문자열 타입의 변수일 수도 있다는 것이다.

잘못된 예측에 의해 작성된 프로그램은 당연히 오류를 뿜어낼 것이다. 결국 동적 타입 언어는 유연성은 높지만 신뢰성은 떨어진다.

다음은 변수를 사용할 때 주의 사항이다.

  • 변수는 꼭 필요한 경우에 한해 제한적으로 사용한다. 변수가 많아질수록 오류가 발생할 확률도 높아진다.
  • 변수의 유효 범위(스코프)는 최대한 좁게 만들어 변수의 부작용을 억제한다.
  • 전역 변수는 최대한 자제한다. 어디서든지 참조/변경이 가능한 변수는 그만큼 의도치 않게 값이 변경될 가능성이 높고 다른 코드에 영향을 줄 가능성도 높다. 
  • 변수보다는 상수를 사용해 값의 변경을 억제한다.
  • 변수 이름은 변수의 목적이나 의미를 파악할 수 있도록 네이밍한다. 변수 뿐만 아니라 모든 식별자는 존재 이유를 파악할 수 있는 적절한 이름으로 짓는다.이는 곧 협업과 생산성 향상에 도움을 준다.

 코드는 오해하지 않도록 작성해야 한다. 오해는 커뮤니케이션을 어렵게 하는 대표적인 원인으로 생산성을 떨어뜨리는 것은 물론 팀의 사기까지 저하시킨다. 코드는 동작하는 것만이 존재 목적은 아니다. 코드는 개발자를 위한 문서이기도 하다. 따라서 사람이 이해할 수 있는 코드, 즉 가독성이 좋은 코드가 좋은 코드다.

마치며

컴퓨터가 이해하는 코드는 어떤 바보도 쓸 수 있다.
하지만 훌륭한 프로그래머는 사람이 이해할 수 있는 코드를 쓴다.
- 마틴 파울러(Martin Fowler)

 

참고 문헌

- 이웅모. 『모던 자바스크립트 Deep Dive』. 위키북스, 2020.

반응형

'기술 학습 > JavaScript' 카테고리의 다른 글

15장 let, const 키워드와 블록 레벨 스코프  (0) 2023.07.20
8장 제어문  (0) 2023.06.28
5장 표현식과 문  (0) 2023.05.30
4장 변수  (0) 2023.05.27
1장 프로그래밍, 2장 자바스크립트란?  (0) 2023.05.25