国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

后綴數組(不小于k個字符串中的最長子串)

2019-11-08 01:45:56
字體:
來源:轉載
供稿:網友

POJ 3294 Life Forms 題意:輸入n個DNA序列,你的任務是求出一個長度最大的字符串,使得它在超過一般的DNA序列中出現。如果有多解,按照字典序從小到大輸入所有解,無解輸出?。 思路:把所有的都連接起來,用不同的字符隔開,求其后綴數組和height數組,然后二分長度,按照長度分組,判斷是否有一組有超過一半的字符串,最后根據長度輸出答案;

/*** 倍增算法(n*logn)* 待排序數組長度為n,放在0~n-1中,在最后補0* sa為后綴數組,把后綴從小到大排序把后綴開頭存起來,rank為名次數組,以i開頭的后綴在所有后綴中排第幾* sa的有效值為1~n,sa[0]必為n無效* rank的有效值為0~n-1,rank[n]必為0無效* height的有效值為2~n,前兩個為0**/#include<cstdio>#include<cstring>#include<cstdlib>#include<iostream>#include<algorithm>using namespace std;const int maxn=1e6+10;int x[maxn],n,k;int wa[maxn],wb[maxn],ww[maxn],wv[maxn],nn,Z=1;char str[100010];int pos[maxn];//記錄是i位置的字符是第幾個字符串的字符int cmp(int *r,int a,int b,int l){ return r[a]==r[b]&&r[a+l]==r[b+l];}void da(int *r,int *sa,int n,int m)//求的數組,得到的后綴數組,最長長度+1,數組里的最大值(一般180或者255);{ int i,j,p,*x=wa,*y=wb,*t; for(i=0; i<m; i++) ww[i]=0; for(i=0; i<n; i++) ww[x[i]=r[i]]++; for(i=1; i<m; i++) ww[i]+=ww[i-1]; for(i=n-1; i>=0; i--) sa[--ww[x[i]]]=i; //處理長度為一的字符串,得到sa數組 for(j=1,p=1; p<n; j*=2,m=p) //倍增法求sa { for(p=0,i=n-j; i<n; i++) y[p++]=i; for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;//利用上次的sa直接求出按第二個關鍵字排序 for(i=0; i<n; i++) wv[i]=x[y[i]]; //第二關鍵字的排序得出第一關鍵字的順序 for(i=0; i<m; i++) ww[i]=0; for(i=0; i<n; i++) ww[wv[i]]++; for(i=1; i<m; i++) ww[i]+=ww[i-1]; for(i=n-1; i>=0; i--) sa[--ww[wv[i]]]=y[i]; //根據第一關鍵字的順序排出sa數組的順序 for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++) //更新x數組 x為rank數組 x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } return ;}int h[maxn];//也就是排名相鄰的兩個后綴的最長公共前綴sa[i]和sa[i-1]int Rank[maxn];//名次數組void get_height(int *r,int *sa,int n)//同上,n小1{ int k=0,i,j; for(int i=1; i<=n; i++) Rank[sa[i]]=i; for(int i=0; i<n; h[Rank[i++]]=k) for(k?k--:0,j=sa[Rank[i]-1]; r[i+k]==r[j+k]; k++) ; return ;}int RMQ[maxn],mm[maxn],best[20][maxn];void initRMQ(int n)//初始化RMQ{ for(int i=1; i<=n; i++) RMQ[i]=h[i]; mm[0]=-1; for(int i=1; i<=n; i++) mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1]; for(int i=1; i<=n; i++) best[0][i]=i; for(int i=1; i<=mm[n]; i++) for(int j=1; j+(1<<i)-1<=n; j++) { int a=best[i-1][j]; int b=best[i-1][j+(1<<(i-1))]; if(RMQ[a]<RMQ[b]) best[i][j]=a; else best[i][j]=b; }}int askRMQ(int a,int b){ int t; t=mm[b-a+1]; b-=(1<<t)-1; a=best[t][a],b=best[t][b]; return RMQ[a]<RMQ[b]?a:b;}int lcp(int a,int b)//詢問a,b后綴的最長公共前綴{ a=Rank[a],b=Rank[b]; if(a>b) swap(a,b); return h[askRMQ(a+1,b)];}int sa[maxn],r[maxn];int judge_Find(int l,int r)//判斷從l到r這段區間是否滿足條件{ if(r-l<=n/2) return 0;//長度不夠 int flag[110],cont=0; memset(flag,0,sizeof(flag)); for(int i=l; i<r; i++) { int z=pos[sa[i]];//該字符是哪個字符串里的 if(!flag[z]&&z!=0)//判斷該字符串是否出現過 { cont++;//個數加1 flag[z]=1;//標記為出現過 } } return cont>n/2;}int Find(int mid,int PRint){ int l=0; for(int r=1; r<=nn; r++) { if(h[r]<mid||r==nn)//不滿足分組條件 { if(judge_Find(l,r))//判斷前一個分組是否滿足條件 { if(print)//輸出答案 { for(int i=sa[l]; i<sa[l]+mid; i++) printf("%c",x[i]+'a'-1); printf("/n"); } else return 1; } l=r;//更新左區間 } } return 0;}int main(){ while(~scanf("%d",&n)&&n) { int cont=0,cnt=0; for(int i=0; i<n; i++) { scanf("%s",str); for(int j=0; j<strlen(str); j++) { pos[cont]=i+1;//給每一個字符編號,同一個字符串里的字符編號相同 x[cont++]=str[j]-'a'+1; } x[cont++]=i+100; } pos[cont]=0; x[cont++]=0; nn=cont; da(x,sa,nn,300); get_height(x,sa,nn-1); if(n==1)//特判長度為一 { printf("%s/n/n",str); continue; } if(!Find(1,0))//長度為1無解則說明無解 { printf("?/n/n"); continue; } int l=1,r=strlen(str),ans=0; while(l<=r) { int mid=(l+r)>>1; if(Find(mid,0)) l=mid+1,ans=mid; else r=mid-1; } Find(ans,1); printf("/n"); }}
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 日照市| 山阴县| 鄂尔多斯市| 乌苏市| 绥中县| 峡江县| 临夏县| 汝阳县| 克拉玛依市| 望城县| 北碚区| 漯河市| 琼中| 兴宁市| 库车县| 清原| 淳化县| 盱眙县| 房产| 马山县| 西宁市| 尤溪县| 道真| 灵丘县| 京山县| 连平县| 淅川县| 冀州市| 明水县| 偃师市| 承德市| 彩票| 托克托县| 汾西县| 城口县| 仁怀市| 乌审旗| 行唐县| 桐城市| 陈巴尔虎旗| 西乌|