【华为OJ】【算法总篇章】
【华为OJ】【089-DNA序列】
【工程下载】
题目描述
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次
数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入描述
输入一个string型基因序列,和int型子串的长度
输出描述
找出GC比例最高的字串
输入例子
AACTGTGCACGACCTGA
5
输出例子
GCACG
算法实现
import java.util.Scanner;
/**
* Author: 王俊超
* Date: 2016-01-06 15:18
* All Rights Reserved !!!
*/
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
// Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt"));
while (scanner.hasNext()) {
String input = scanner.nextLine();
int n = scanner.nextInt();
System.out.println(maxRatio(input, n));
}
scanner.close();
}
/**
* 初始化两个数组,一个序列数值数组K[N],一个序列和数组SUM[N],先遍历一边序列,
* 为C或者G则K[i]为1,否则则置为0,然后计算连续M个K[I]之和存入SUM就行。
*
* @param s
* @param m
* @return
*/
private static String maxRatio(String s, int m) {
int[] k = new int[s.length()];
int[] sum = new int[s.length()];
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (c == ‘C‘ || c == ‘G‘) {
k[i]++;
}
}
for (int i = 0; i < k.length - m; i++) {
for (int j = 0; j < m; j++) {
sum[i] += k[i + j];
}
}
int max = 0;
int idx = 0;
for (int i = 0; i < k.length - 1; i++) {
if (sum[i] > max) {
max = sum[i];
idx = i;
}
}
return s.substring(idx, idx + m);
}
}
时间: 2024-10-12 08:52:33