mayoko’s diary

プロコンとかいろいろ。

Good Bye 2015 D. New Year and Ancient Prophecy

解法

問題設定がこの問題に非常に似ています。
mayokoex.hatenablog.com

まず大雑把に解法を説明します。

dp[i][j] = (i 番目までの数を分割した時, 最後の数は j 桁であるような場合の数) とします。また,
dpSum[i][j] = (i 番目までの数を分割した時, 最後の数は j 桁以下であるような場合の数) とします。

すると, dp[i][j] は以下のようにして求められます。
最後の数は j 桁なので, 最後の数は i-j 個目の数から始まっています。もし i-j 番目の数字が 0 だったら, leading zero はダメの法則に反するので, dp[i][j] = 0 です。
pi = i-2*j とすると, これは最後の数の一つ前の数が始まる可能性のある最も 0 に近い index を表します。
もし pi < 0 なら, 最後の数の一つ前の数は最後の数よりも桁が小さいので, 絶対に最後の数のほうが大きいです。この場合は, dp[i][j] = dpSum[i-j][j] で終わりです。
pi >= 0 の場合は, pi から始まる j 桁の数と, i-j から始まる j 桁の数でどちらが大きいかを比較します。もし後者の方が大きいなら, 最後の数の一つ前の数は j 桁であっても良いので, dp[i][j] = dpSum[i-j][j] です。そうでない場合は, 最後の数の一つ前の数は j 桁であっては困るので, dp[i][j] = dpSum[i-j][j-1] です。

最後に, dpSum[i][j] は dp[i][j] の各値から dpSum[i] は O(n) で計算できます。

ここで問題なのは, 「pi から始まる j 桁の数と, i-j から始まる j 桁の数でどちらが大きいかを比較」するところです。ここで O(n) の計算量がかかると, 全体の計算量が O(n^3) となり死にます。

ここを O(1) で計算したいです。そこで役に立つのが SA を使った lcp の計算です。冒頭に載せた問題と同様に, lcp を使って値の比較をすると, O(1) で数の比較ができるので, O(n^2) で答えを得られます。

#define _CRT_SECURE_NO_WARNINGS

#include <stdio.h>
#include <algorithm>
#include <string.h>
#include<iostream>

using namespace std;

#define FOR(i,a,b) for(int i=a;i<b;i++)
typedef long long ll;
typedef vector<int> vi;
typedef vector<ll> vll;
typedef pair<int, int> pii;

#define REP(i,b) FOR(i,0,b)

const int Nmax = 5555;
int bucket[Nmax];

template <class T>
void CreateBeginBucket(T* data, int size, int maxVal){
    REP(i, maxVal + 1) bucket[i] = 0;
    REP(i, size) bucket[data[i]]++;
    int sum = 0;
    REP(i, maxVal + 1){ bucket[i] += sum; swap(bucket[i], sum); }
}

template <class T>
void CreateEndBucket(T* data, int size, int maxVal){
    REP(i, maxVal + 1) bucket[i] = 0;
    REP(i, size) bucket[data[i]]++;
    int sum = 0;
    REP(i, maxVal + 1){ sum += bucket[i]; bucket[i] = sum; }
}

template<class T>
void InducedSort(T* data, int size, int* SA, int maxVal, bool* isL){
    CreateBeginBucket(data, size, maxVal);
    REP(i, size) if (SA[i] > 0 && isL[SA[i] - 1]) SA[bucket[data[SA[i] - 1]]++] = SA[i] - 1;
}

template<class T>
void InvertInducedSort(T* data, int size, int* SA, int maxVal, bool* isL){
    CreateEndBucket(data, size, maxVal);
    for (int i = size - 1; i >= 0; --i) if (SA[i] > 0 && !isL[SA[i] - 1]) SA[--bucket[data[SA[i] - 1]]] = SA[i] - 1;
}

template <class T>
void DBGOUT(T* sa, int size){
    REP(i, size) printf("%d ", int(sa[i]));
    printf("\n");
}

template<class T>
void SA_IS(T* data, int size, int* SA, int maxVal, bool* isL){
    REP(i, size) SA[i] = -1;
#define isLMS(x) (x>0 && isL[x-1] && !isL[x])
    isL[size - 1] = false;
    for (int i = size - 2; i >= 0; i--) isL[i] = data[i] > data[i + 1] || (data[i] == data[i + 1] && isL[i + 1]);
    CreateEndBucket(data, size, maxVal);
    FOR(i, 1, size) if (isLMS(i)) SA[--bucket[data[i]]] = i;
    InducedSort(data, size, SA, maxVal, isL);
    InvertInducedSort(data, size, SA, maxVal, isL);

    int c = 0;
    REP(i, size) if (isLMS(SA[i])) SA[c++] = SA[i];
    FOR(i, c, size) SA[i] = -1;

    int idx = -1;
    int prev = -1;
    REP(i, c){
        bool diff = false;
        REP(d, size){
            if (prev == -1 || data[SA[i] + d] != data[prev + d] || isL[SA[i] + d] != isL[prev + d]){
                diff = true;
                break;
            }
            else if (d > 0 && isLMS(SA[i] + d)) break;
        }
        if (diff){ idx++; prev = SA[i]; }
        SA[c + SA[i] / 2] = idx;
    }
    int j = size;
    for (int i = size - 1; i >= c; i--) if (SA[i] >= 0) SA[--j] = SA[i];

    int* nxdata = SA + size - c;
    int* nxsa = SA;
    if (c == idx + 1) REP(i, c) nxsa[nxdata[i]] = i;
    else SA_IS(nxdata, c, nxsa, idx, isL + size);

    j = c;
    for (int i = size - 1; i >= 1; i--) if (isLMS(i)) nxdata[--j] = i;
    REP(i, c) nxsa[i] = nxdata[nxsa[i]];
    FOR(i, c, size) SA[i] = -1;
    CreateEndBucket(data, size, maxVal);
    for (int i = c - 1; i >= 0; i--) swap(nxsa[i], SA[--bucket[data[nxsa[i]]]]);
    InducedSort(data, size, SA, maxVal, isL);
    InvertInducedSort(data, size, SA, maxVal, isL);
}

// SA_IS
// input: 対象となる文字列
// size : 文字列の長さ
// SA   : 返される suffix array
bool isLPool[Nmax * 2];
void SA_IS(unsigned char* input, int size, int* SA){
    int mv = 0;
    REP(i, size) if (mv < input[i]) mv = input[i];
    SA_IS(input, size, SA, mv, isLPool);
}

// CreateLCP
// data: 対象となる文字列
// size: 文字列の長さ
// SA  : dataの suffix array の情報
// lcp という配列に情報が保存される
int lcp[Nmax];
int invertSA[Nmax];
void CreateLCP(unsigned char* data, int size, int* SA){
    lcp[0] = -1;
    REP(i, size) invertSA[SA[i]] = i;
    int prev = 0;
    REP(i, size){
        if (invertSA[i] > 0){
            while (data[i + prev] == data[SA[invertSA[i] - 1] + prev]){
                ++prev;
                if (i + prev >= size || SA[invertSA[i] - 1] + prev >= size)
                    break;
            }
            lcp[invertSA[i]] = prev;
        }
        prev = max(prev - 1, 0);
    }
}

int st[21][Nmax];
void InitSparseTable(int n){
    int h = 1;
    while ((1 << h) < n) h++;
    REP(i, n) st[0][i] = lcp[i];
    FOR(j, 1, h + 1){
        REP(i, n - (1<<j) + 1){
            st[j][i] = min(st[j - 1][i], st[j - 1][i + (1 << (j - 1))]);
        }
    }
}

inline int TopBit(int t){
    for (int i = 20; i >= 0; i--){
        if ((1 << i)&t) return i;
    }
    return -1;
}

int GetLCP(int f, int s){
    if (f > s) swap(f, s);
    int diff = TopBit(s-f);
    return min(st[diff][f], st[diff][s - (1 << diff)]);
}

unsigned char str[Nmax];
int indices[Nmax];

int compare(int f, int s, int l){
    int fi = invertSA[f];
    int si = invertSA[s];
    if (GetLCP(fi + 1, si + 1) >= l)
        return 0;
    else
        return 2 * (fi > si) - 1;
}

ll dp[Nmax][Nmax];
ll dpSum[Nmax][Nmax];

int main() {
    const ll MOD = 1e9+7;
    int n;
    scanf("%d", &n);
    scanf("%s", str);
    SA_IS(str, n + 1, indices);
    CreateLCP(str, n + 1, indices);
    InitSparseTable(n + 1);
    dp[0][0] = 1;
    for (int i = 0; i <= n; i++) dpSum[0][i] = 1;
    for (int i = 1; i <= n; i++) {
        for (int j = 1; j <= i; j++) {
            if (str[i-j] == '0') continue;
            int ni = i-2*j;
            if (ni < 0) {
                dp[i][j] = dpSum[i-j][j];
                continue;
            }
            if (compare(ni, i-j, j) < 0) {
                dp[i][j] = dpSum[i-j][j];
            } else {
                dp[i][j] = dpSum[i-j][j-1];
            }
        }
        dpSum[i][0] = dp[i][0];
        for (int j = 1; j <= n; j++) {
            dpSum[i][j] = dpSum[i][j-1] + dp[i][j];
            dpSum[i][j] %= MOD;
        }
    }
    cout << dpSum[n][n] << endl;
    return 0;
}