백준 문자열제곱 4354

728x90

https://www.acmicpc.net/problem/4354

4354번: 문자열 제곱

문제 알파벳 소문자로 이루어진 두 문자열 a와 b가 주어졌을 때, a*b는 두 문자열을 이어붙이는 것을 뜻한다. 예를 들어, a="abc", b="def"일 때, a*b="abcdef"이다. 이러한 이어 붙이는 것을 곱셈으로 생각한다면, 음이 아닌 정수의 제곱도 정의할 수 있다. a^0 = "" (빈 문자열) a^(n+1) = a*(a^n) 문자열 s가 주어졌을 때, 어떤 문자열 a에 대해서 s=a^n을 만족하는 가장 큰 n을 찾는 프로그램을 작성하시오.

www.acmicpc.net

KMP 알고리즘에서 사용되는 prefix 테이블을 이용하여 풀 수 있는 문제다.

prefix테이블이란 문자열의 접두어(prefix)와 접미어(suffix)의 최대 겹치는 길이를 저장하는 테이블이다.

ACACABCACA 라는 길이가 10인 문자열을 사용해서 prefix 테이블가 무엇인지 또 어떻게 만드는지에 대해서 설명하겠다.

prefix 테이블을 만들기 위해서는 두개의 포인터가 필요하다.편의상 i,j라고 하고 i는 문자열 전체를 탐색하는 포인터, j는 i에 저장될 index를 저장할 포인터 정보이며, i는 1부터 j는 0부터 시작한다.

j	i
A	C	A	C	A	B	C	A	C	A
0	0	0	0	0	0	0	0	0	0

s[j]! = s[i] 이므로 i만 증가시킨다.

j		i
A	C	A	C	A	B	C	A	C	A
0	0	1	0	0	0	0	0	0	0

s[j] = s[i] 이므로 prefix[i]에 j+1를 저장하고 i와 j모두 증가시켜준다.

prefix[2] =1 이라는 말은

ACA라는 문자열에 prefix = suffix가 같은 길이가 1인 부분 문자열이 있다는 뜻이다.(이 경우 A이다.)

	j		i
A	C	A	C	A	B	C	A	C	A
0	0	1	2	0	0	0	0	0	0

s[j] = s[i] 이므로 prefix[i]에 j+1를 저장하고 i와 j모두 증가시켜준다.

prefix[3] =2 이라는 말은

ACAC라는 문자열에 prefix = suffix가 같은 길이가 2인 부분 문자열이 있다는 뜻이다.(이 경우 AC이다.)

		j		i
A	C	A	C	A	B	C	A	C	A
0	0	1	2	3	0	0	0	0	0

s[j] = s[i] 이므로 prefix[i]에 j+1를 저장하고 i와 j모두 증가시켜준다.

prefix[4] =23 이라는 말은

ACACA라는 문자열에 prefix = suffix가 같은 길이가 3인 부분 문자열이 있다는 뜻이다.(이 경우 ACA이다.)

			j		i
A	C	A	C	A	B	C	A	C	A
0	0	1	2	3	0	0	0	0	0

s[j] != s[i]이다.

이 경우 s[i]!=s[j] 가 만족할때까지 j를 prefix[j-1]로 옮긴다.

prefix [j-1] = 1 로 j를 1로 옮겼기만 C!= B이므로

다시 prefix[j-1] =0 으로 옮겼깆만 A!=B 이다.

그러므로 prefix[5] = 0 이다.

끝까지 못찾았으므로 i만 증가시킨다.

(ACACAB에서 직접 보면 알겠지만 prefix = suffix인 부분문자열을 찾을수 없다.)

j						i
A	C	A	C	A	B	C	A	C	A
0	0	1	2	3	0	0	0	0	0

s[j] != s[i]이다. i 만 증가시킨다.

j							i
A	C	A	C	A	B	C	A	C	A
0	0	1	2	3	0	0	1	0	0

s[i] ==s[j] 이다. i,j모두 1씩 증가시킨다.

ACACACABCA에서 prefix= suffix인 최대길이 부분 문자열은 1이다. (A)

	j							i
A	C	A	C	A	B	C	A	C	A
0	0	1	2	3	0	0	1	2	0

s[i] ==s[j] 이다. i,j모두 1씩 증가시킨다.

ACACACABCAC에서 prefix= suffix인 최대길이 부분 문자열은 2이다. (AC)

		j							i
A	C	A	C	A	B	C	A	C	A
0	0	1	2	3	0	0	1	2	3

s[i] ==s[j] 이다. i,j모두 1씩 증가시킨다.

ACACACABCACA에서 prefix= suffix인 최대길이 부분 문자열은 3이다. (ACA)

이과정을 코드로 나타내면 다음과 같다.

for(i =1 ;i <input.length();i++) {
				
				while(j>0 && input.charAt(i)!=input.charAt(j)){
					j= prefix[j-1];
				}
				if(input.charAt(i)==input.charAt(j)) {
						prefix[i] = j+1;
						j++;
				}
			}

이제 prefix 테이블을 이용해서 문자열 제곱문제를 풀어보자

위에서 만들어진 prefix테이블을 통해 prefix = suffix 인 최대길이 부분문자열 정보를 가지고 있다.

그렇다면 prefix [len-1]에는 문자열 전체의 prefix = suffix인 최대길이 부분문자열이 들어있을것이다.

ABCABCABC 라는 문자열이 있다면

prefix table은

000123456 으로

len = 9

prefix[len-1] = 6이다.

편의상 [x : y]를 x부터 y까지의 부분문자열이라고 가정하면

[0 : 6] = [len-1-6 : len-1] 이 성립하므로

[0 : len- prefix[len-1]] = [0 : 3] 이 문자열에서 반복한다는 것을 알수 있다..

단 len % prefix[len-1] !=0인 경우 중간에 다른 문자가 껴있는 경우이므로 거듭제곱이 성립하지 않는다.

예를 들어 ABCDABC의 경우 prefix[len-1] = 3이고, len =7 이므로 7%(7-3)!=0이다.

반면 ABCABCD의 경우 prefix[len-1] = 4이고 len=8이므로 8%(8-4)==0이다.

이 원리를 이용하면 쉽게 문자열 최대 거듭제곱을 구할수 있다.

package 백준;

import java.util.*;
import java.io.*;

public class 문자열제곱 {
	public static class MyScanner {
		BufferedReader bf;
		StringTokenizer st;

		MyScanner() {
			bf = new BufferedReader(new InputStreamReader(System.in));
		}

		String next() {
			while (st == null || !st.hasMoreTokens()) {
				try {
					st = new StringTokenizer(bf.readLine());
				} catch (Exception e) {
					e.printStackTrace();
				}

			}
			return st.nextToken();
		}

		public int nextInt() {
			return Integer.parseInt(next());
		}

		public long nextLong() {
			return Long.parseLong(next());
		}
	}
	public static void main(String[] args) throws Exception{
		//System.setIn(new FileInputStream("res/문자열제곱.txt"));
		MyScanner sc = new MyScanner();
		String input;
		while(true) {
			input = sc.next();
			if(input.equals(".")) break;
			int prefix[] = new int[input.length()];
			int i ,j=0;
			for(i =1 ;i <input.length();i++) {
				
				while(j>0 && input.charAt(i)!=input.charAt(j)){
					j= prefix[j-1];
				}
				if(input.charAt(i)==input.charAt(j)) {
						prefix[i] = j+1;
						j++;
				}
			}
			
		//	for(i =0 ;i <prefix.length;i++) {
		//		System.out.print(prefix[i] + " ");
		//	}
		//	System.out.println();
			
			int len = input.length();
			
			boolean flag = true;
			int answer = 0;
			int end = prefix[len-1];
			if(end==0) {
				flag = false;
			}else {
				if(len%(len-end)!=0) flag = false;
				else answer = len/(len-end);
			}
			//System.out.printf("prefix =%d d=%d\n",prefix[len-1],d);
			if(!flag) System.out.println("1");
			else System.out.println(answer);
		}
		
	}
}

저작자표시

'알고리즘 > 백준' 카테고리의 다른 글

백준 15927 회문은 회문아니야!! (0)	2020.05.07
백준 13907 세금 (0)	2020.05.06
백준 15824 너 봄 캡사이신이 맛있단다. (0)	2020.04.29
백준 1669멍멍이 쓰다듬기 (0)	2020.04.23
백준 18808 스티커 붙이기 (0)	2020.04.19

부s 블로그

백준 문자열제곱 4354

'알고리즘 > 백준' 카테고리의 다른 글

티스토리툴바

백준 문자열제곱 4354

'알고리즘 > 백준' 카테고리의 다른 글

'알고리즘/백준' Related Articles

티스토리툴바