文字列内のすべての文字のインデックス


101

次のコードは2を出力します

String word = "bannanas";
String guess = "n";
int index;
System.out.println( 
    index = word.indexOf(guess)
);

文字列「bannanas」の「n」(「推測」)のすべてのインデックスを取得する方法を知りたい

予想される結果は次のとおりです。 [2,3,5]

回答:


162

これは-1Peter Lawreyの解法 持っいた最後の位置なしでポジションのリストを印刷するはずです。

int index = word.indexOf(guess);
while (index >= 0) {
    System.out.println(index);
    index = word.indexOf(guess, index + 1);
}

forループとしても実行できます。

for (int index = word.indexOf(guess);
     index >= 0;
     index = word.indexOf(guess, index + 1))
{
    System.out.println(index);
}

[注:guess単一の文字よりも長い場合は、guess文字列を分析することによりword、上記のループよりも速くループすることができます。このようなアプローチのベンチマークは、Boyer-Mooreアルゴリズムです。ただし、そのようなアプローチを使用することを好む条件は存在しないようです。]


28

以下を試してください(最後に-1は印刷されません!)

int index = word.indexOf(guess);
while(index >= 0) {
   System.out.println(index);
   index = word.indexOf(guess, index+1);
}

1
常に最後に-1を印刷します
lukastymo

@ピーター回答ありがとうございます。正解のようです、今日はJavaの初日なので、最終結果に少し戸惑いました。最後に-1が出力されたようです。理由がよくわかります。ありがとう!!
Trufa

@Trufa:indexOf文字が見つからない場合は-1を返すため、常に最後に-1が出力されます。
ColinD

@Trufa- ループが-1最後に出力する理由は、doループが本体を実行し、それをindex == -1終端で発見するためwhileです。
テッドホップ

@ColinD私が得る部分、私が理解していないのは、それが起こるために関数で何が起こっているかであり、それは文字の出現を探して単語を「ループ」し、それが見つかるまで、それ以上正しいものを見つけることができません?そして、この最後のインデックスが見つからない(-1)を出力しますが、何が起こっているのですか?(それが正しく行われたかどうかはわかりません)
トルファ

7
String string = "bannanas";
ArrayList<Integer> list = new ArrayList<Integer>();
char character = 'n';
for(int i = 0; i < string.length(); i++){
    if(string.charAt(i) == character){
       list.add(i);
    }
}

結果は次のように使用されます:

    for(Integer i : list){
        System.out.println(i);
    }

または配列として:

list.toArray();


3
int index = -1;
while((index = text.indexOf("on", index + 1)) >= 0) {
   LOG.d("index=" + index);
}

1
String word = "bannanas";

String guess = "n";

String temp = word;

while(temp.indexOf(guess) != -1) {
     int index = temp.indexOf(guess);
     System.out.println(index);
     temp = temp.substring(index + 1);
}

一般的な考え方は正しいですが、word.substring(word)コンパイルされません。:P
Peter Lawrey

1
それでも問題があります。継続的に印刷されます2.
POSIX_ME_HARDER

まあ、私はここに投稿するすべてのものをjavacする必要があります。
asgs

1

これは、Java 9で正規表現を使用して機能的に行うことができます。

Pattern.compile(Pattern.quote(guess)) // sanitize input and create pattern
            .matcher(word) // create matcher
            .results()     // get the MatchResults, Java 9 method
            .map(MatchResult::start) // get the first index
            .collect(Collectors.toList()) // collect found indices into a list
    );

CharSequence拡張メソッドを使用してこのロジックを新しい新しいメソッドとしてAPI に追加するKotlinソリューションは次のとおりです。

 // Extension method
fun CharSequence.indicesOf(input: String): List<Int> =
    Regex(Pattern.quote(input)) // build regex
        .findAll(this)          // get the matches
        .map { it.range.first } // get the index
        .toCollection(mutableListOf()) // collect the result as list

// call the methods as
"Banana".indicesOf("a") // [1, 3, 5]

0
    String input = "GATATATGCG";
    String substring = "G";
    String temp = input;
    String indexOF ="";
    int tempIntex=1;

    while(temp.indexOf(substring) != -1)
    {
        int index = temp.indexOf(substring);
        indexOF +=(index+tempIntex)+" ";
        tempIntex+=(index+1);
        temp = temp.substring(index + 1);
    }
    Log.e("indexOf ","" + indexOF);

0

また、文字列内の文字列のすべてのインデックスを検索する場合。

int index = word.indexOf(guess);
while (index >= 0) {
    System.out.println(index);
    index = word.indexOf(guess, index + guess.length());
}

これは、「すべての出来事」の意味に曖昧さを生じさせる点で興味深いです。だった場合とあった場合、で1回発生するか2回発生するかは明確でguess "aba"ありません。(つまり、2つの異なる位置から開始できることは明らかですが、発生が重複しているため、両方をカウントする必要があるかどうかは不明です。)この回答は、重複する発生は別個としてカウントされないという見解を示しています。もちろん、OPの表現では、これは常に長さが1になることを強く示唆しているため、あいまいさは発生しません。word"ababa"guesswordguessguess
テッド・ホップ2016年

0

この方法を思いつくまで、私にもこの問題がありました。

public static int[] indexesOf(String s, String flag) {
    int flagLen = flag.length();
    String current = s;
    int[] res = new int[s.length()];
    int count = 0;
    int base = 0;
    while(current.contains(flag)) {
        int index = current.indexOf(flag);
        res[count] = index + base;
        base += index + flagLen;
        current = current.substring(current.indexOf(flag) + flagLen, current.length());
        ++ count;
    }
    return Arrays.copyOf(res, count);
}

このメソッドを使用して、文字列内の任意の長さのフラグのインデックスを検索できます。次に例を示します。

public class Main {

    public static void main(String[] args) {
        int[] indexes = indexesOf("Hello, yellow jello", "ll");

        // Prints [2, 9, 16]
        System.out.println(Arrays.toString(indexes));
    }

    public static int[] indexesOf(String s, String flag) {
        int flagLen = flag.length();
        String current = s;
        int[] res = new int[s.length()];
        int count = 0;
        int base = 0;
        while(current.contains(flag)) {
            int index = current.indexOf(flag);
            res[count] = index + base;
            base += index + flagLen;
            current = current.substring(current.indexOf(flag) + flagLen, current.length());
            ++ count;
        }
        return Arrays.copyOf(res, count);
    }
}

0

私が思いついた文字列を分割するためのクラス。最後に短いテストが提供されます。

SplitStringUtils.smartSplitToShorterStrings(String str, int maxLen, int maxParts) 可能な場合は単語を分割せずにスペースで分割し、そうでない場合はmaxLenに従ってインデックスで分割します。

分割方法を制御するために提供される他のメソッド:bruteSplitLimit(String str, int maxLen, int maxParts)spaceSplit(String str, int maxLen, int maxParts)

public class SplitStringUtils {

  public static String[] smartSplitToShorterStrings(String str, int maxLen, int maxParts) {
    if (str.length() <= maxLen) {
      return new String[] {str};
    }
    if (str.length() > maxLen*maxParts) {
      return bruteSplitLimit(str, maxLen, maxParts);
    }

    String[] res = spaceSplit(str, maxLen, maxParts);
    if (res != null) {
      return res;
    }

    return bruteSplitLimit(str, maxLen, maxParts);
  }

  public static String[] bruteSplitLimit(String str, int maxLen, int maxParts) {
    String[] bruteArr = bruteSplit(str, maxLen);
    String[] ret = Arrays.stream(bruteArr)
          .limit(maxParts)
          .collect(Collectors.toList())
          .toArray(new String[maxParts]);
    return ret;
  }

  public static String[] bruteSplit(String name, int maxLen) {
    List<String> res = new ArrayList<>();
    int start =0;
    int end = maxLen;
    while (end <= name.length()) {
      String substr = name.substring(start, end);
      res.add(substr);
      start = end;
      end +=maxLen;
    }
    String substr = name.substring(start, name.length());
    res.add(substr);
    return res.toArray(new String[res.size()]);
  }

  public static String[] spaceSplit(String str, int maxLen, int maxParts) {
    List<Integer> spaceIndexes = findSplitPoints(str, ' ');
    List<Integer> goodSplitIndexes = new ArrayList<>();
    int goodIndex = -1; 
    int curPartMax = maxLen;
    for (int i=0; i< spaceIndexes.size(); i++) {
      int idx = spaceIndexes.get(i);
      if (idx < curPartMax) {
        goodIndex = idx;
      } else {
        goodSplitIndexes.add(goodIndex+1);
        curPartMax = goodIndex+1+maxLen;
      }
    }
    if (goodSplitIndexes.get(goodSplitIndexes.size()-1) != str.length()) {
      goodSplitIndexes.add(str.length());
    }
    if (goodSplitIndexes.size()<=maxParts) {
      List<String> res = new ArrayList<>();
      int start = 0;
      for (int i=0; i<goodSplitIndexes.size(); i++) {
        int end = goodSplitIndexes.get(i);
        if (end-start > maxLen) {
          return null;
        }
        res.add(str.substring(start, end));
        start = end;
      }
      return res.toArray(new String[res.size()]);
    }
    return null;
  }


  private static List<Integer> findSplitPoints(String str, char c) {
    List<Integer> list = new ArrayList<Integer>();
    for (int i = 0; i < str.length(); i++) {
      if (str.charAt(i) == c) {
        list.add(i);
      }
    }
    list.add(str.length());
    return list;
  }
}

簡単なテストコード:

  public static void main(String[] args) {
    String [] testStrings = {
        "123",
        "123 123 123 1123 123 123 123 123 123 123",
        "123 54123 5123 513 54w567 3567 e56 73w45 63 567356 735687 4678 4678 u4678 u4678 56rt64w5 6546345",
        "1345678934576235784620957029356723578946",
        "12764444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444444",
        "3463356 35673567567 3567 35 3567 35 675 653 673567 777777777777777777777777777777777777777777777777777777777777777777"
    };

    int max = 35;
    int maxparts = 2;


    for (String str : testStrings) {
      System.out.println("TEST\n    |"+str+"|");
      printSplitDetails(max, maxparts);
      String[] res = smartSplitToShorterStrings(str, max, maxparts);
      for (int i=0; i< res.length;i++) {
        System.out.println("  "+i+": "+res[i]);
      }
      System.out.println("===========================================================================================================================================================");
    }

  }

  static void printSplitDetails(int max, int maxparts) {
    System.out.print("  X: ");
    for (int i=0; i<max*maxparts; i++) {
      if (i%max == 0) {
        System.out.print("|");
      } else {
        System.out.print("-");
      }
    }
    System.out.println();
  }

0

これはJava 8ソリューションです。

public int[] solution (String s, String subString){
        int initialIndex = s.indexOf(subString);
        List<Integer> indexList = new ArrayList<>();
        while (initialIndex >=0){
            indexList.add(initialIndex);
            initialIndex = s.indexOf(subString, initialIndex+1);
        }
        int [] intA = indexList.stream().mapToInt(i->i).toArray();
        return intA;
    }

-1

これはmyStringfromIndexパラメータを反復してシフトすることで実行できますindexOf()

  int currentIndex = 0;

  while (
    myString.indexOf(
      mySubstring,
      currentIndex) >= 0) {

    System.out.println(currentIndex);

    currentIndex++;
  }

このコードを実行してみましたか?各位置で見つかるmySubstringかどうかに関係なく、の最後の発生のインデックスまですべての位置(0、1、2、...)を出力しますmySubstring。ないOPが望んですべてで...
テッドのHopp

-4

これを試して

String str = "helloslkhellodjladfjhello";
String findStr = "hello";

System.out.println(StringUtils.countMatches(str, findStr));

これは、より大きな文字列内の部分文字列のインスタンスをカウントするのに適していますが、一致のインデックスを返しません。
5つのクラブ

このコードは質問に答えることがありますが、問題を解決する方法および/または理由に関する追加のコンテキストを提供すると、回答の長期的な価値が向上します。
Nic3500

これは質問の答えにはなりません。質問には、すべてのインデックスのリストが必要です
sheu
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.