자바에서 문자열을 다루기 위해서는 String 클래스의 메소드를 사용합니다. 이번 포스팅에서는 String 메소드를 설명하고 간단한 사용법울 알아보도록 하겠습니다.

 

int length()

문자열의 길이를 반환합니다. C언어로 치면 strlen과 같은 메소드겠네요. 사용법이 너무 간단하므로 예를 보이지는 않겠습니다.

 

String substring(int beginIndex)

String substring(int beginIndex, int endIndex)

substring 메소드는 beginIndex부터 문자열끝까지의 문자열을 반환합니다. 만약 끝을 가리키는 endIndex를 사용한다면 문자열의 특정 구간의 문자열을 반환합니다. 아래는 사용 예를 보여줍니다.

 

String str="AABBCCDD";
System.out.println(str.substring(2));
System.out.println(str.substring(2, 4));

"AABBCCDD"의 substring(2)는 처음 나오는 B의 자리를 인자로 전달합니다. 문자열의 첫번째 인덱스는 0부터 시작한다는 것을 잊지마세요. 그러니 처음 나오는 A의 인덱스는 0입니다. 결과는 B부터 문자열의 끝까지 새로운 문자열을 반환합니다.

또 substring(2,4)는 2번째 인덱스부터 4번째 인덱스 전까지 새로운 문자열을 반환합니다. 주의해야할 것은 4번 인덱스 앞까지라는 것입니다. 그러므로 4번 인덱스의 문자는 포함되지 않습니다. 결과는 "BB"라는 문자열이 반환되겠네요.

 

위의 결과는 아래와 같습니다.

 

결과

BBCCDD
BB

 

 

 

 

char charAt(int index)

문자열에서 char 값이 필요할때 사용하는 메소드입니다. 인자 index는 문자열에서 한 문자를 뽑아낼 위치를 말합니다.

String str="AABBCCDD";
System.out.println(str.charAt(4));
System.out.println(str.charAt(str.length()-1));

 

예를 들어 "AABBCCDD"라는 문자열에서 4번째 인덱스의 char 값을 얻고 싶다면 인자로 4를 넣어주면 됩니다. 그렇다면 처음 나오는 'C'가 될겁니다. 또는 마지막 문자열의 문자를 추출해내고 싶다면 length() 메소드의 반환값에서 1을 뺀 값을 전달하면 제일 마지막 문자를 가져올 수 있습니다.

 

결과

C
D

 

String concat(String str)

문자열을 합치는 메소드입니다. str을 현재 문자열 뒤에 추가합니다. 사실 저는 별로 이 메소드를 사용하지는 않는데요. 자바에서는 문자열을 합칠때 + 연산으로 합칠 수 있기 때문이지요.

String str="AABBCCDD";
System.out.println(str.concat("EE"));
System.out.println(str+"EE");

 

아래에서 똑같은 결과를 볼 수 있지요.

 

결과

AABBCCDDEE

AABBCCDDEE

 

boolean contains(CharSequence s)

문자열에서 특정 문자열이 포함되어있는지 여부를 확인하려면 이 메소드를 사용하면 됩니다. 매개변수에 포함됐는지의 문자열을 전달하고 문자열이 포함되어 있다면 true, 포함되지 않았다면 false를 반환합니다.

 

String str="AABBCCDD";
System.out.println(str.contains("BC"));
System.out.println(str.contains("AD"));

"BC"는 "AABBCCDD"에 포함되어 있으므로 true를 반환할 것이고, "AD"라는 문자열을 포함되어 있지 않으니 false를 반환합니다.

 

결과

true
false

 

 

 

 

static String copyValueOf(char []data)

static String copyValueOf(char []data, int offset, int count)

이 메소드는 static 메소드입니다. char형 배열을 문자열로 변환할때 사용하는 메소드인데요. 그냥 char 배열을 전달하면 그 배열 자체를 문자열로 반환합니다.

특정 위치에서 몇개의 문자까지 문자열로 받고 싶다면 offset에 특정 문자열을 얻고 싶은 위치를, count에 몇개의 문자를 받을 지를 전달하면 되겠습니다.

char []charArray={'A','B','C','D','E','F'};
System.out.println(String.copyValueOf(charArray));
System.out.println(String.copyValueOf(charArray,2,4));		

 

결과를 보면 직관적으로 이 메소드가 어떤 기능을 하는지 알 수 있을 겁니다.

 

결과

ABCDEF
CDEF

 

String[] split(String regex)

String[] split(String regex, int limit)

정규표현식을 기준으로 문자열을 쪼갭니다. 정규표현식을 몰라도 됩니다. 만약 limit에 인자를 전달하면 그 limit까지만 문자열을 쪼갭니다.

 

String str="AABB__CCDD__EEFF";
String []arr=str.split("__");
for(int i=0;i<arr.length;i++)
	System.out.println(arr[i]);

"AABB__CCDD__EEFF"를 "__"로 분리시켜보면 세개의 문자열이 나옵니다. "AABB", "CCDD", "EEFF"가 그것들이죠. 이것은 한가지 예이므로 쉼표로 분리하고 싶다면 쉼표로 분리할 수도 있습니다.

 

결과

AABB
CCDD
EEFF

 

String toLowerCase()

String toLowerCase(Locale locale)

String toUpperCase()

String toUpperCase(Locale locale)

문자열을 전부 소문자 또는 전부 대문자로 변환된 문자열을 얻고 싶을 때 위의 메소드를 사용하면 됩니다.

소문자로 변환된 문자열을 얻고 싶을때는 toLowerCase, 대문자로 변환된 문자열을 얻고 싶을때는 toUpperCase를 사용하면 되는 것이죠. 메소드 인자는 Locale은 사실 써본적은 없습니다. 인자없는 toLowerCase, toUpperCase로도 충분해 보입니다.

String str1="AABBCCDD";
String str2="ffgghhii";
System.out.println(str1.toLowerCase());
System.out.println(str2.toUpperCase());

 

"AABBCCDD"는 toLowerCase로 소문자로 출력하고, "ffgghhii"는 toUpperCase로 모두 대문자로 출력합니다.

 

결과

aabbccdd
FFGGHHII

 

 

int compareTo(String anotherString)

문자열을 사전순으로 비교합니다. 만약 anotherString이 사전순으로 앞에 등장할때는 양수를 반환하고 사전순으로 늦게 등장할때는 음수를 반환합니다. 만약 anotherString이 현재 문자열과 정확히 같다면 0을 반환하게 됩니다. 문자열을 비교할때는 equals를 주로 사용하는데요. 사전순으로 비교하고 싶을땐 compareTo를 사용하면 됩니다.

 

String str1="BCD";
String str2="ABC";
String str3="BCD";
String str4="CDE";
System.out.println(str1.compareTo(str2));
System.out.println(str1.compareTo(str3));
System.out.println(str1.compareTo(str4));

 

"ABC"는 "BCD" 기준으로 사전상 앞에 등장하니까 양수, "CDE"는 "BCD" 기준으로 사전상 뒤에 등장하니까 음수가 반환됩니다. str1과 str3은 문자열이 같으므로 0이 반환됩니다.

 

결과

1
0
-1

 

 

 

 

int compareToIgnoreCase(String str)

만약 소문자, 대분자를 무시하고 비교하고 싶을때는 이 메소드를 사용하면 됩니다. 원래 "ABC"와 "abc"를 compareTo 메소드로 비교하면 0이 반환되지 않습니다만 이 메소드를 사용해서 비교한다면 0이 반환됩니다.

String str1="abc";
String str2="ABC";
String str3="abc";
String str4="aaa";
System.out.println(str1.compareToIgnoreCase(str2));
System.out.println(str1.compareToIgnoreCase(str3));
System.out.println(str1.compareToIgnoreCase(str4));

 

str4와 비교하는 것을 제외하고는 0을 반환하겠군요.

 

결과

0
0
1

 

 

boolean equals(Object anObjec)

boolean equalsIgnoreCase(String anotherString)

사전순으로 비교할 필요없이 단순히 문자열이 같은지 다른지 비교할때는 이 메소드를 씁니다. 역시 대소문자를 구분하지 않는다면 equalsIgnoreCase를 사용하면 됩니다. 같다면 true, 다르면 false를 반환합니다.

 

 

static String format(String format, Object ...args)

특정 format으로된 문자열을 얻고 싶을때 사용하는 메소드입니다. C언어에서 이것과 비슷한 기능을 하는 sprintf가 되겠네요. 

String str=String.format("%d+%d=%d", 1,2,1+2);
System.out.println(str);

 

C언어를 사용했던 분들에게는 조금 익숙한 메소드겠네요.

 

결과

1+2=3

 

boolean startsWith(String prefix)

boolean startsWith(String prefix, int toffset)

boolean endsWith(String suffix)

startsWith는 문자열이 prefix로 시작하는지 확인하는 메소드입니다. prefix의 비교 위치를 지정하려면 startsWith의 두번째 메소드를 사용하면 됩니다.

endsWith는 문자열이 suffix의 문자열로 끝나는지 확인하는 메소드입니다. suffix로 끝난다면 true, 다르게 끝나면 false를 반환합니다.

		
String str="ABCDEF";
System.out.println(str.startsWith("AB"));
System.out.println(str.startsWith("BC",1));
System.out.println(str.endsWith("EF"));
System.out.println(str.endsWith("EE"));

결과

true
true
true
false

 

 

 

 

 

String replace(char oldChar, char newChar)

String replace(CharSequence target, CharSequence replacement)

String replaceAll(String regex, String replacement)

String replaceFirst(String regex, String replacement)

문자나 문자열을 다른 문자나 문자열로 바꾸고 싶을때 사용하는 메소드입니다. 메소드 이름이 직관적이기 때문에 사용법을 익히는데 그리 어렵지 않을 겁니다. 또는 아래의 예를 보고 이해하면 되겠지요.

String str="AB-----AB-----AB";
String str1=str.replaceFirst("AB", "ab");
String str2=str.replace("AB", "ab");
String str3=str.replaceAll("AB", "ab");
String str4=str.replace('A', 'a');
System.out.println(str1);
System.out.println(str2);
System.out.println(str3);
System.out.println(str4);

 

결과

ab-----AB-----AB
ab-----ab-----ab
ab-----ab-----ab
aB-----aB-----aB

 

사실 이 중에서도 자주 쓰이는거 외에는 별로 쓸 일이 없을 겁니다. 자주 필요한 몇가지만 기억해두면 될 것 같네요. 다음 포스팅에서도 String 메소드에 대해서 더 알아보도록 합시다.

반응형
블로그 이미지

REAKWON

와나진짜

,

문자열과 char 포인터

오늘은 심심한데 문자열에 대해서 이야기 해볼까 해요~ 문자열과 포인터는 C언어에서 너무나 귀찮은 놈들인데,,, 그래도 꼭 쓰이니까요. char 자료형은 문자를 변수로 갖는 건 모두 아는 사실이죠?

근데~ 우리는 문자열을 쉽게 할당하고 싶단 말이에요. 우리는 배열이라는 아주 편리한 변수 선언 법을 알고 있답니다.

배열로 문자열을 표현하는 방법을 알아보겠습니다.

char hello[6] = { 'h','e','l','l','o','\0' };

이 표현은 char이 자료형을 배열로 문자열을 표현한 방법이랍니다. '\0' 라는 문자는 NULL문자라는 뜻입니다. 문자열의 끝을 알려줍니다.

그래서 hello가 다섯글자임에도 불구하고 배열 크기를 6으로 잡은 겁니다.

또 이런 선언법도 가능합니다.

char hello[6] = "hello";

그렇다면 우리가 문자열의 길이를 알고 싶다면 널문자가 나타나기 전까지만 세어주면 문자열의 길이를 알 수 있겠네요.

#include <stdio.h>

int main() {
        char *ptr = "ABCDEF";
        int len = -1;
       
        while (*(ptr+(++len)));
        printf("문자열 길이: %d\n", len);
}

그 결과는 이렇겠네요.

 

len=-1인 이유는 null문자 이전까지만 세어주기 위함입니다. while의 조건절은 null이면 멈추어 버립니다. 여기까지는 쉽네요. 포인터로는 어떻게 표현할까요?

사실 문자열("~~~~")은 그 문자열이 시작되는 주소를 가리키게 됩니다. 주소를 가리킨다!?  그러면 포인터가 생각나지 않나요?

왜냐면 주소를 포인터로 가리키면 문자열을 찾을 수 있으니까요.

그러면 이렇게 선언할 수 있을까요?

char *ptr = "hello";

포인터 ptr은 "hello"라는 문자열을 가리키는 포인터입니다. 

그림에서 보는 것과 같이 ptr은 문자열 "hello"의 주소를 가리키고 있고, 그렇기 때문에 참조가 가능한 상태가 됩니다. 그렇다면 어떤 포인터 역시 hello를 가리킨다면 그 주소는 같을까요?

코드와 결과로 확인해보도록 합시다.

 

#include <stdio.h>  int main() {   	char *ptr1 = "hello"; 	char *ptr2 = "hello"; 	printf("%s, %s\n", ptr1, ptr2); 	printf("%p, %p\n", ptr1, ptr2); } #include <stdio.h> 

int main() {   
        char *ptr1 = "hello"; 
        char *ptr2 = "hello"; 

        printf("%s, %s\n", ptr1, ptr2);
        printf("%p, %p\n", ptr1, ptr2);
}

 

같다는 것을 알 수 있습니다. 우리는 이런 그림을 그려볼 수 있겠네요.

ptr1과 ptr2는 서로 같은 문자열을 가리킵니다.  배열과 포인터에 대해서 선언방법은 그렇게 차이가 없어보이죠?

그렇다면 문자열 배열과 포인터는 서로 같은 성질을 갖고 있을까요?

만약 아래와 같은 코드를 입력한다 arr에 ptr가 가리키는 문자열을 넣으라는 거겠죠??

char arr[10] = "world";

char *ptr = "hello";

arr = ptr;

 "hello"라는 문자열의 길이는 배열크기보다 작기 때문에 들어갈 것입니다. 이렇게 생각하셨다면 다시 생각해봅시다. 오류나니까요.

문자열 "hello" 그 주소 자체를 반환합니다. 그러니까 "hello"의 시작주소가 되는 것이죠. 그것이 ptr이 갖고 있는 값입니다.

arr자체는 arr[0]의 주소, 즉 배열의 시작 위치를 말합니다. 이러한 시작 주소를 마음대로 ptr이 가리키고 있는 주소로 바꿀 수 없습니다.

이 의미는 더 쉽게 풀어서 이야기하면

int a = 0;

int b = 30;

&a = b;

랑 유사한 짓거리를 하는 것이라는 거죠. 마치 a의 주소를 b의 값으로 변경하라는 것과 유사하게 되어버립니다.

하지만 그 반대는 가능합니다. 이렇게요.

char arr[10] = "world" ;

char *ptr = "hello";

ptr = arr;

ptr은 주소를 갖을 수 있는 포인터, arr은 arr[0]의 주소! 말이 되죠 이건??

그러니 ptr은 arr과 동일한 곳을 가리키게 되는 겁니다.

만약

arr = ptr;

이걸 죽어도 써야겠다. 난 arr에다가 ptr의 문자열을 진짜 안쓰면 디질거 같다.  하시는 분들은 ptr의 문자열을 복사해서 쓰는 방법밖에 없습니다.

strcpy(arr, ptr)

이렇게 하시면 arr에 ptr이 가리키는 문자열을 그대로 복사해서 arr에 쑤셔 넣습니다. 주의 할 사항은 arr의 크기는 ptr이 가리키고 있는 문자열의 길이 이상으로 커야한다는 겁니다.

그렇지 않으면 런타임 오류납니다. 컴파일에서 문자열의 길이를 검사하지 않습니다!

이 오류가 바로 그 유명한 버퍼오버플로우(buffer overflow)가 됩니다. 취약점인거죠. 버퍼오버플로우를 통해 해커는 함수의 return 주소를 변경하여 자신의 실행코드를 실행합니다. 별짓을 다할 수가 있게 됩니다그래서 그 대안으로 strncpy, strncat 이런것이 나오게 된겁니다.

그리고 또!

포인터와 배열에는 다른 차이점이 있습니다.

문자열을 초기화 할때 배열은 배열 원소를 변경할 수 있지만, 포인터는 배열의 원소를 바꿀 수 없습니다. 즉, 포인터로 초기화 한다면 상수적인 성격을 띈다라는 것입니다.

가령, 아래 코드가 있다면 ptr[0] 변경시 오류가 발생합니다.

char hello[10] = "hello";

char *ptr = "hello";

ptr[0] = 'H';  //오류

hello[0] = 'H';

하지만

char hello[10] = "hello";

char *ptr = hello; 

ptr[0] = 'H'; 

hello[0] = 'H';

이건 오류가 나지 않습니다. 왜냐면 hello는 배열이거든요. 배열은 그 원소의 값이 변경가능합니다. ptr은 배열의 시작주소를 참조하고 있는 포인터이기 때문입니다.

 

그래서 이러한 strcat를 써먹을때도

#include <stdio.h>
#include <string.h>  

int main() {
        char *hello = "hello, ";  
        strcat(hello, "world");
        printf("%s\n", hello);
}

가 아닌

#include <stdio.h>
#include <string.h>

int main() { 
        char hello[20] = "hello, ";  
        strcat(hello, "world");
        printf("%s\n", hello);
}

 

이런 형태나

#include <stdio.h>
#include <string.h>  

int main() {  
        char hello[20] = "hello, ";
        char *ptr = hello;  
        strcat(ptr, "world");  
        printf("%s\n", ptr);
}

이런식으로 쓰여야 한다는 겁니다. 이렇게 간단하게 문자열과 포인터에 대해서 알아보았습니다. 부족한 점은 나중에 또 보충 설명해보도록 할게요 ㅎㅎ

 

 

반응형
블로그 이미지

REAKWON

와나진짜

,