正規表現を可能にするJavaScriptのString.indexOf()のバージョンはありますか?


214

JavaScriptでは、最初の最初のパラメータに文字列の代わりに正規表現を取り、2番目のパラメータを許可するString.indexOf()に相当するものはありますか?

私は何かをする必要があります

str.indexOf(/[abc]/ , i);

そして

str.lastIndexOf(/[abc]/ , i);

String.search()は正規表現をパラメーターとして取りますが、2番目の引数を指定することはできません!

編集:
これは最初に思ったよりも難しいことが判明したので、提供されたすべてのソリューションをテストする小さなテスト関数を書きました... regexIndexOfとregexLastIndexOfがStringオブジェクトに追加されていることを前提としています。

function test (str) {
    var i = str.length +2;
    while (i--) {
        if (str.indexOf('a',i) != str.regexIndexOf(/a/,i)) 
            alert (['failed regexIndexOf ' , str,i , str.indexOf('a',i) , str.regexIndexOf(/a/,i)]) ;
        if (str.lastIndexOf('a',i) != str.regexLastIndexOf(/a/,i) ) 
            alert (['failed regexLastIndexOf ' , str,i,str.lastIndexOf('a',i) , str.regexLastIndexOf(/a/,i)]) ;
    }
}

そして、私は次のようにテストして、少なくとも1文字の正規表現について、結果がindexOfを使用した場合と同じであることを確認しています

// xes
test( 'xxx');の中でaを探します
test( 'axx');
test( 'xax');
test( 'xxa');
test( 'axa');
test( 'xaa');
test( 'aax');
test( 'aaa');


|内部[ ]はリテラル文字と一致します|。たぶん[abc]
Markus Jarderot、2008年

はい、ありがとうございます。正解ですが、正規表現自体は無関係です...
Pat

フィードバックをありがとう、私の回答Patを更新しました。
Jason Bunting

私はstring.match(/ [AZ] /)を使用する方が簡単で効果的なアプローチだとわかりました。ない場合、メソッドはnullを返します。それ以外の場合、オブジェクトを取得するには、match(/ [AZ]
/)。indexを実行して

回答:


129

すでに述べたいくつかのアプローチを組み合わせると(indexOfは明らかにかなり単純です)、これらはトリックを実行する関数だと思います。

String.prototype.regexIndexOf = function(regex, startpos) {
    var indexOf = this.substring(startpos || 0).search(regex);
    return (indexOf >= 0) ? (indexOf + (startpos || 0)) : indexOf;
}

String.prototype.regexLastIndexOf = function(regex, startpos) {
    regex = (regex.global) ? regex : new RegExp(regex.source, "g" + (regex.ignoreCase ? "i" : "") + (regex.multiLine ? "m" : ""));
    if(typeof (startpos) == "undefined") {
        startpos = this.length;
    } else if(startpos < 0) {
        startpos = 0;
    }
    var stringToWorkWith = this.substring(0, startpos + 1);
    var lastIndexOf = -1;
    var nextStop = 0;
    while((result = regex.exec(stringToWorkWith)) != null) {
        lastIndexOf = result.index;
        regex.lastIndex = ++nextStop;
    }
    return lastIndexOf;
}

明らかに、組み込みのStringオブジェクトを変更すると、ほとんどの人に危険信号が送信されますが、これはそれほど大きな問題ではない場合もあります。単にそれに気をつけてください。


更新:regexLastIndexOf()それはlastIndexOf()今模倣するように編集されました。それでも失敗するかどうか、またどのような状況下かをお知らせください。


更新:このページのコメントで見つかったすべてのテストに合格します。もちろん、だからといって完全に防弾であるとは限りません。フィードバックを歓迎します。


あなたのregexLastIndexOf意志は、最後のインデックスを返す非オーバーラップマッチを。
Markus Jarderot、2008年

申し訳ありませんが、巨大な正規表現の男ではありません。私の失敗の原因となる例を教えてください。私はもっ​​と学ぶことができて感謝していますが、あなたの返答は私ほど無知な人を助けません。:)
Jason Bunting

ジェイソン私は質問でテストするためにいくつかの機能を追加しました。これは(他のテストの中で)失敗し、次の 'axx'.lastIndexOf(' a '、2)!=' axx'.regexLastIndexOf(/ a /、2)
Pat

2
regex.lastIndex = result.index + 1;代わりに使用する方が効率的だと思いますregex.lastIndex = ++nextStop;。結果を失うことなく、うまくいけば次の試合に早く進みます。
Gedrox、2012年

1
npmからプルしたい場合は、これらの2つのユーティリティ関数がNPMに次のように含まれています。npmjs.com
package

185

Stringコンストラクターのインスタンスには、RegExpを受け入れ、最初に一致したインデックスを返す.search()メソッドがあります。

特定の位置から検索を開始するには(の2番目のパラメーターを模倣して.indexOf()slice、最初のi文字をオフにします。

str.slice(i).search(/re/)

ただし、これは(最初の部分が切り取られた後の)短い文字列のインデックスを取得するので、切り取られた部分の長さ(i)を、返されたインデックスに追加します(そうでない場合)-1。これにより、元の文字列のインデックスが得られます。

function regexIndexOf(text, re, i) {
    var indexInSuffix = text.slice(i).search(re);
    return indexInSuffix < 0 ? indexInSuffix : indexInSuffix + i;
}

1
質問から:String.search()は正規表現をパラメーターとして受け取りますが、2番目の引数を指定することはできません!
パット

14
str.substr(i).search(/ re /)
Glenn、

6
素晴らしいソリューションですが、出力は少し異なります。indexOfは最初から(オフセットに関係なく)数値を返しますが、これはオフセットから位置を返します。:だから、パリティのため、あなたはもっとこのような何かをしたいだろうfunction regexIndexOf(text, offset) { var initial = text.substr(offset).search(/re/); if(initial >= 0) { initial += offset; } return initial; }
gkoberger

39

短いバージョンがあります。それは私にとってうまくいきます!

var match      = str.match(/[abc]/gi);
var firstIndex = str.indexOf(match[0]);
var lastIndex  = str.lastIndexOf(match[match.length-1]);

プロトタイプバージョンが必要な場合:

String.prototype.indexOfRegex = function(regex){
  var match = this.match(regex);
  return match ? this.indexOf(match[0]) : -1;
}

String.prototype.lastIndexOfRegex = function(regex){
  var match = this.match(regex);
  return match ? this.lastIndexOf(match[match.length-1]) : -1;
}

編集:fromIndexのサポートを追加する場合

String.prototype.indexOfRegex = function(regex, fromIndex){
  var str = fromIndex ? this.substring(fromIndex) : this;
  var match = str.match(regex);
  return match ? str.indexOf(match[0]) + fromIndex : -1;
}

String.prototype.lastIndexOfRegex = function(regex, fromIndex){
  var str = fromIndex ? this.substring(0, fromIndex) : this;
  var match = str.match(regex);
  return match ? str.lastIndexOf(match[match.length-1]) : -1;
}

これを使用するには、次のように簡単です。

var firstIndex = str.indexOfRegex(/[abc]/gi);
var lastIndex  = str.lastIndexOfRegex(/[abc]/gi);

これは実際には素晴らしいトリックです。あなたはそれをも取るように展開されている場合は素晴らしいことだstartIndexいつものようにパラメータをindeoxOfしてlastIndexOfください。
Robert Koritnik 2015

@RobertKoritnik-サポートstartIndex(またはfromIndex)への回答を編集しました。それが役に立てば幸い!
pmrotule

lastIndexOfRegexの値もfromIndex結果に追加する必要があります。
Peter

次のシナリオでは、アルゴリズムが壊れ"aRomeo Romeo".indexOfRegex(new RegExp("\\bromeo", 'gi'));ます。indexOfは、単語の先頭にあるかどうかに関係なく、最初に「romeo」が表示されるときに検索するため、結果は7であるはずですが1になります。
KorelK

13

使用する:

str.search(regex)

こちらのドキュメントをご覧ください。


11
@OZZIE:いいえ、実際には違います。それは基本的にGlennの回答です(賛成150票まで)。ただし、説明まったくなく、以外の開始位置をサポート0、投稿されました... 7年後。
ccjmne

7

BaileyPの回答に基づく。主な違いは-1、パターンが一致しない場合にこれらのメソッドが返されることです。

編集:ジェイソン・バンティングの回答のおかげで、アイデアが浮かびました。なぜ.lastIndex正規表現のプロパティを変更しないのですか?ただし、これはグローバルフラグ(/g)のあるパターンでのみ機能します。

編集:テストケースに合格するように更新されました。

String.prototype.regexIndexOf = function(re, startPos) {
    startPos = startPos || 0;

    if (!re.global) {
        var flags = "g" + (re.multiline?"m":"") + (re.ignoreCase?"i":"");
        re = new RegExp(re.source, flags);
    }

    re.lastIndex = startPos;
    var match = re.exec(this);

    if (match) return match.index;
    else return -1;
}

String.prototype.regexLastIndexOf = function(re, startPos) {
    startPos = startPos === undefined ? this.length : startPos;

    if (!re.global) {
        var flags = "g" + (re.multiline?"m":"") + (re.ignoreCase?"i":"");
        re = new RegExp(re.source, flags);
    }

    var lastSuccess = -1;
    for (var pos = 0; pos <= startPos; pos++) {
        re.lastIndex = pos;

        var match = re.exec(this);
        if (!match) break;

        pos = match.index;
        if (pos <= startPos) lastSuccess = pos;
    }

    return lastSuccess;
}

これはこれまでのところ最も有望であるようです(いくつかの構文の修正後)。'axx'.lastIndexOf(' a '、0)のようなもの!=' axx'.regexLastIndexOf(/ a /、0)...それらのケースを修正できるかどうかを調べるために調べています
Pat

6

substrを使用できます。

str.substr(i).match(/[abc]/);

O'Reillyによって発行された有名なJavaScriptの本から:「substrはECMAScriptによって標準化されていないため、非推奨です。」しかし、私はあなたが得ているものの背後にある基本的な考え方が好きです。
Jason Bunting

1
それは問題ではありません。本当に心配している場合は、代わりにString.substring()を使用してください-少し異なる方法で計算する必要があります。その上、JavaScriptはその母国語に対して100%守られるべきではありません。
Peter Bailey、

これは問題ではありません。substrを実装していない実装に対してコードが実行されると、ECMAScript標準に準拠したいため、問題が発生します。確かに、それをサブストリングで置き換えることはそれほど難しくはありませんが、これを認識することは良いことです。
Jason Bunting

1
問題が発生した瞬間に、非常にシンプルな解決策が得られます。コメントは理にかなっていると思いますが、反対票は多面的でした。
VoronoiPotato 2013年

回答を編集して、機能するデモコードを提供していただけませんか?
vsync

5

RexExpインスタンスには既にlastIndexプロパティがあります(グローバルの場合)。そのため、正規表現をコピーし、目的に合わせてわずかに変更execし、文字列にそれを追加してを確認しますlastIndex。これは必然的に文字列のループよりも高速になります。(これを文字列プロトタイプに配置する方法の十分な例がありますよね?)

function reIndexOf(reIn, str, startIndex) {
    var re = new RegExp(reIn.source, 'g' + (reIn.ignoreCase ? 'i' : '') + (reIn.multiLine ? 'm' : ''));
    re.lastIndex = startIndex || 0;
    var res = re.exec(str);
    if(!res) return -1;
    return re.lastIndex - res[0].length;
};

function reLastIndexOf(reIn, str, startIndex) {
    var src = /\$$/.test(reIn.source) && !/\\\$$/.test(reIn.source) ? reIn.source : reIn.source + '(?![\\S\\s]*' + reIn.source + ')';
    var re = new RegExp(src, 'g' + (reIn.ignoreCase ? 'i' : '') + (reIn.multiLine ? 'm' : ''));
    re.lastIndex = startIndex || 0;
    var res = re.exec(str);
    if(!res) return -1;
    return re.lastIndex - res[0].length;
};

reIndexOf(/[abc]/, "tommy can eat");  // Returns 6
reIndexOf(/[abc]/, "tommy can eat", 8);  // Returns 11
reLastIndexOf(/[abc]/, "tommy can eat"); // Returns 11

RegExpオブジェクトに関数のプロトタイプを作成することもできます。

RegExp.prototype.indexOf = function(str, startIndex) {
    var re = new RegExp(this.source, 'g' + (this.ignoreCase ? 'i' : '') + (this.multiLine ? 'm' : ''));
    re.lastIndex = startIndex || 0;
    var res = re.exec(str);
    if(!res) return -1;
    return re.lastIndex - res[0].length;
};

RegExp.prototype.lastIndexOf = function(str, startIndex) {
    var src = /\$$/.test(this.source) && !/\\\$$/.test(this.source) ? this.source : this.source + '(?![\\S\\s]*' + this.source + ')';
    var re = new RegExp(src, 'g' + (this.ignoreCase ? 'i' : '') + (this.multiLine ? 'm' : ''));
    re.lastIndex = startIndex || 0;
    var res = re.exec(str);
    if(!res) return -1;
    return re.lastIndex - res[0].length;
};


/[abc]/.indexOf("tommy can eat");  // Returns 6
/[abc]/.indexOf("tommy can eat", 8);  // Returns 11
/[abc]/.lastIndexOf("tommy can eat"); // Returns 11

変更方法の簡単な説明RegExpindexOfグローバルフラグが設定されていることを確認する必要があるだけです。以下のためlastIndexOfの私がない限り、最後に出現を見つけるために、負の先読みを使用していますRegExpすでに文字列の末尾に一致しました。


4

ネイティブではありませんが、この機能を追加できます

<script type="text/javascript">

String.prototype.regexIndexOf = function( pattern, startIndex )
{
    startIndex = startIndex || 0;
    var searchResult = this.substr( startIndex ).search( pattern );
    return ( -1 === searchResult ) ? -1 : searchResult + startIndex;
}

String.prototype.regexLastIndexOf = function( pattern, startIndex )
{
    startIndex = startIndex === undefined ? this.length : startIndex;
    var searchResult = this.substr( 0, startIndex ).reverse().regexIndexOf( pattern, 0 );
    return ( -1 === searchResult ) ? -1 : this.length - ++searchResult;
}

String.prototype.reverse = function()
{
    return this.split('').reverse().join('');
}

// Indexes 0123456789
var str = 'caabbccdda';

alert( [
        str.regexIndexOf( /[cd]/, 4 )
    ,   str.regexLastIndexOf( /[cd]/, 4 )
    ,   str.regexIndexOf( /[yz]/, 4 )
    ,   str.regexLastIndexOf( /[yz]/, 4 )
    ,   str.lastIndexOf( 'd', 4 )
    ,   str.regexLastIndexOf( /d/, 4 )
    ,   str.lastIndexOf( 'd' )
    ,   str.regexLastIndexOf( /d/ )
    ]
);

</script>

私はこれらのメソッドを完全にテストしませんでしたが、これまでのところ機能しているようです。


それらのケースを処理するように更新
Peter Bailey、

私がこの回答を受け入れようとするたびに、新しいケースを見つけます!これらは異なる結果をもたらします!alert([str.lastIndexOf(/ [d] /、4)、str.regexLastIndexOf(/ [d] /、4)]);
パット

もちろん、そうです-str.lastIndexOfはパターンに対して型強制を行います-それを文字列に変換します。文字列 "/ [d] /"が入力に含まれていないことが最も確実であるため、返される-1は実際には正確です。
Peter Bailey、

とった。String.lastIndexOf()の仕様を読んだ後、私はその引数がどのように機能するかを誤解しました。この新しいバージョンで処理できます。
Peter Bailey、

まだ問題がありますが、遅くなっています...テストケースを取得して、午前中に修正する可能性があります。これまでのトラブルでごめんなさい。
Pat

2

提案されたすべてのソリューションが何らかの方法でテストに失敗した後(編集:いくつかは、これを書いた後にテストに合格するように更新されました)、Array.indexOfおよびArray.lastIndexOfのモジラ実装を見つけました

これらを使用して、私のバージョンのString.prototype.regexIndexOfおよびString.prototype.regexLastIndexOfを次のように実装しました。

String.prototype.regexIndexOf = function(elt /*, from*/)
  {
    var arr = this.split('');
    var len = arr.length;

    var from = Number(arguments[1]) || 0;
    from = (from < 0) ? Math.ceil(from) : Math.floor(from);
    if (from < 0)
      from += len;

    for (; from < len; from++) {
      if (from in arr && elt.exec(arr[from]) ) 
        return from;
    }
    return -1;
};

String.prototype.regexLastIndexOf = function(elt /*, from*/)
  {
    var arr = this.split('');
    var len = arr.length;

    var from = Number(arguments[1]);
    if (isNaN(from)) {
      from = len - 1;
    } else {
      from = (from < 0) ? Math.ceil(from) : Math.floor(from);
      if (from < 0)
        from += len;
      else if (from >= len)
        from = len - 1;
    }

    for (; from > -1; from--) {
      if (from in arr && elt.exec(arr[from]) )
        return from;
    }
    return -1;
  };

彼らは質問で提供したテスト機能に合格したようです。

明らかに、正規表現が1文字と一致する場合にのみ機能しますが、([abc]、\ s、\ W、\ D)のようなものに使用するので、私の目的にはそれで十分です。

誰かが任意の正規表現で機能するより良い/より速い/よりクリーン/より一般的な実装を提供する場合、私は質問を監視し続けます。


うわー、それはコードの長いビットです。私の更新された回答を確認し、フィードバックを提供してください。ありがとう。
Jason Bunting

この実装は、FirefoxのlastIndexOfおよびSpiderMonkey JavaScriptエンジンとの完全な互換性を目指しています。[...]現実のアプリケーションでは、これらのケースを無視すると、複雑でないコードで計算できる場合があります。
パット

mozillaページを作成します:-)私はコードの変更を2行行って、すべてのエッジケースを残しました。他のいくつかの回答がテストに合格するように更新されたので、それらをベンチマークして、最も効率的なものを受け入れます。問題を再検討する時間があるとき。
パット

私は自分のソリューションを更新し、それが失敗する原因となるフィードバックや事柄に感謝します。MizardXが指摘した重複問題を修正するために変更を加えました(うまくいけば!)
Jason Bunting

2

regexIndexOf配列にも関数が必要だったので、自分でプログラムしました。しかし、私はそれが最適化されていることを疑いますが、私はそれが適切に動作するはずだと思います。

Array.prototype.regexIndexOf = function (regex, startpos = 0) {
    len = this.length;
    for(x = startpos; x < len; x++){
        if(typeof this[x] != 'undefined' && (''+this[x]).match(regex)){
            return x;
        }
    }
    return -1;
}

arr = [];
arr.push(null);
arr.push(NaN);
arr[3] = 7;
arr.push('asdf');
arr.push('qwer');
arr.push(9);
arr.push('...');
console.log(arr);
arr.regexIndexOf(/\d/, 4);

1

特定の単純なケースでは、分割を使用して後方検索を簡略化できます。

function regexlast(string,re){
  var tokens=string.split(re);
  return (tokens.length>1)?(string.length-tokens[tokens.length-1].length):null;
}

これにはいくつかの深刻な問題があります:

  1. 重複するマッチは表示されません
  2. 返されるインデックスは、開始ではなく終了時のインデックスです(正規表現が定数の場合は問題ありません)。

しかし、明るい面では、コードがはるかに少なくなります。オーバーラップできない一定の長さの正規表現の場合(/\s\w/単語の境界を見つける場合など)、これで十分です。


0

スパース一致のデータの場合、ブラウザー間でstring.searchを使用するのが最も高速です。文字列を繰り返しごとに次のように再スライスします。

function lastIndexOfSearch(string, regex, index) {
  if(index === 0 || index)
     string = string.slice(0, Math.max(0,index));
  var idx;
  var offset = -1;
  while ((idx = string.search(regex)) !== -1) {
    offset += idx + 1;
    string = string.slice(idx + 1);
  }
  return offset;
}

密なデータのために私はこれを作りました。これは、executeメソッドと比較すると複雑ですが、データが密集している場合、私が試した他のどのメソッドよりも2〜10倍速く、承認されたソリューションよりも約100倍高速です。主なポイントは次のとおりです。

  1. 一度渡された正規表現でexecを呼び出して、一致があることを確認するか、早期に終了します。これは(?=を使用して同様の方法で行いますが、IEでのexecによるチェックは劇的に高速です。
  2. 変更された正規表現を構築し、「(r)」の形式でキャッシュします。(?!。?r) '
  3. 新しい正規表現が実行され、そのexecまたは最初のexecからの結果が返されます。

    function lastIndexOfGroupSimple(string, regex, index) {
        if (index === 0 || index) string = string.slice(0, Math.max(0, index + 1));
        regex.lastIndex = 0;
        var lastRegex, index
        flags = 'g' + (regex.multiline ? 'm' : '') + (regex.ignoreCase ? 'i' : ''),
        key = regex.source + '$' + flags,
        match = regex.exec(string);
        if (!match) return -1;
        if (lastIndexOfGroupSimple.cache === undefined) lastIndexOfGroupSimple.cache = {};
        lastRegex = lastIndexOfGroupSimple.cache[key];
        if (!lastRegex)
            lastIndexOfGroupSimple.cache[key] = lastRegex = new RegExp('.*(' + regex.source + ')(?!.*?' + regex.source + ')', flags);
        index = match.index;
        lastRegex.lastIndex = match.index;
        return (match = lastRegex.exec(string)) ? lastRegex.lastIndex - match[1].length : index;
    };

メソッドのjsPerf

上位のテストの目的がわかりません。正規表現を必要とする状況をindexOfの呼び出しと比較することは不可能です。これは、最初にメソッドを作成するポイントだと思います。テストに合格するには、正規表現の反復方法を調整するよりも、「xxx +(?! x)」を使用する方が理にかなっています。


0

Jason Buntingの最後のインデックスは機能しません。鉱山は最適ではありませんが、機能します。

//Jason Bunting's
String.prototype.regexIndexOf = function(regex, startpos) {
var indexOf = this.substring(startpos || 0).search(regex);
return (indexOf >= 0) ? (indexOf + (startpos || 0)) : indexOf;
}

String.prototype.regexLastIndexOf = function(regex, startpos) {
var lastIndex = -1;
var index = this.regexIndexOf( regex );
startpos = startpos === undefined ? this.length : startpos;

while ( index >= 0 && index < startpos )
{
    lastIndex = index;
    index = this.regexIndexOf( regex, index + 1 );
}
return lastIndex;
}

私の失敗の原因となるテストを提供できますか?それが機能しないことがわかった場合は、テストケースを提供し、なぜ「機能しない」と言って、最適でないソリューションを提供するのですか?
Jason Bunting

やばい あなたは完全に正しいです。私は例を提供するべきでした。残念ながら、私は数か月前にこのコードから移行しましたが、失敗したケースが何であるかわかりません。:-/
Eli

まあ、それは人生です。:)
Jason Bunting 2015年

0

要求されたタスクを実行するネイティブメソッドはまだありません。

これが私が使っているコードです。これは、模倣の行動String.prototype.indexOfString.prototype.lastIndexOf方法を彼らはまた、検索する値を表す文字列に加えて、検索引数として正規表現を受け入れます。

はい、回答が現在の標準にできるだけ近づくように試み、もちろん妥当な量のJSDOCコメントが含まれているため、回答はかなり長くなります。ただし、いったん縮小すると、コードは2.27kになり、転送用にgzipした後は1023バイトになります。

これが追加する2つのメソッドString.prototypeObject.definePropertyを使用できる場合)は次のとおりです。

  1. searchOf
  2. searchLastOf

これは、OPが投稿したすべてのテストに合格します。さらに、日常の使用でルーチンを徹底的にテストし、複数の環境で機能することを確認しようとしましたが、フィードバック/問題はいつでも歓迎します。

/*jslint maxlen:80, browser:true */

/*
 * Properties used by searchOf and searchLastOf implementation.
 */

/*property
    MAX_SAFE_INTEGER, abs, add, apply, call, configurable, defineProperty,
    enumerable, exec, floor, global, hasOwnProperty, ignoreCase, index,
    lastIndex, lastIndexOf, length, max, min, multiline, pow, prototype,
    remove, replace, searchLastOf, searchOf, source, toString, value, writable
*/

/*
 * Properties used in the testing of searchOf and searchLastOf implimentation.
 */

/*property
    appendChild, createTextNode, getElementById, indexOf, lastIndexOf, length,
    searchLastOf, searchOf, unshift
*/

(function () {
    'use strict';

    var MAX_SAFE_INTEGER = Number.MAX_SAFE_INTEGER || Math.pow(2, 53) - 1,
        getNativeFlags = new RegExp('\\/([a-z]*)$', 'i'),
        clipDups = new RegExp('([\\s\\S])(?=[\\s\\S]*\\1)', 'g'),
        pToString = Object.prototype.toString,
        pHasOwn = Object.prototype.hasOwnProperty,
        stringTagRegExp;

    /**
     * Defines a new property directly on an object, or modifies an existing
     * property on an object, and returns the object.
     *
     * @private
     * @function
     * @param {Object} object
     * @param {string} property
     * @param {Object} descriptor
     * @returns {Object}
     * @see https://goo.gl/CZnEqg
     */
    function $defineProperty(object, property, descriptor) {
        if (Object.defineProperty) {
            Object.defineProperty(object, property, descriptor);
        } else {
            object[property] = descriptor.value;
        }

        return object;
    }

    /**
     * Returns true if the operands are strictly equal with no type conversion.
     *
     * @private
     * @function
     * @param {*} a
     * @param {*} b
     * @returns {boolean}
     * @see http://www.ecma-international.org/ecma-262/5.1/#sec-11.9.4
     */
    function $strictEqual(a, b) {
        return a === b;
    }

    /**
     * Returns true if the operand inputArg is undefined.
     *
     * @private
     * @function
     * @param {*} inputArg
     * @returns {boolean}
     */
    function $isUndefined(inputArg) {
        return $strictEqual(typeof inputArg, 'undefined');
    }

    /**
     * Provides a string representation of the supplied object in the form
     * "[object type]", where type is the object type.
     *
     * @private
     * @function
     * @param {*} inputArg The object for which a class string represntation
     *                     is required.
     * @returns {string} A string value of the form "[object type]".
     * @see http://www.ecma-international.org/ecma-262/5.1/#sec-15.2.4.2
     */
    function $toStringTag(inputArg) {
        var val;
        if (inputArg === null) {
            val = '[object Null]';
        } else if ($isUndefined(inputArg)) {
            val = '[object Undefined]';
        } else {
            val = pToString.call(inputArg);
        }

        return val;
    }

    /**
     * The string tag representation of a RegExp object.
     *
     * @private
     * @type {string}
     */
    stringTagRegExp = $toStringTag(getNativeFlags);

    /**
     * Returns true if the operand inputArg is a RegExp.
     *
     * @private
     * @function
     * @param {*} inputArg
     * @returns {boolean}
     */
    function $isRegExp(inputArg) {
        return $toStringTag(inputArg) === stringTagRegExp &&
                pHasOwn.call(inputArg, 'ignoreCase') &&
                typeof inputArg.ignoreCase === 'boolean' &&
                pHasOwn.call(inputArg, 'global') &&
                typeof inputArg.global === 'boolean' &&
                pHasOwn.call(inputArg, 'multiline') &&
                typeof inputArg.multiline === 'boolean' &&
                pHasOwn.call(inputArg, 'source') &&
                typeof inputArg.source === 'string';
    }

    /**
     * The abstract operation throws an error if its argument is a value that
     * cannot be converted to an Object, otherwise returns the argument.
     *
     * @private
     * @function
     * @param {*} inputArg The object to be tested.
     * @throws {TypeError} If inputArg is null or undefined.
     * @returns {*} The inputArg if coercible.
     * @see https://goo.gl/5GcmVq
     */
    function $requireObjectCoercible(inputArg) {
        var errStr;

        if (inputArg === null || $isUndefined(inputArg)) {
            errStr = 'Cannot convert argument to object: ' + inputArg;
            throw new TypeError(errStr);
        }

        return inputArg;
    }

    /**
     * The abstract operation converts its argument to a value of type string
     *
     * @private
     * @function
     * @param {*} inputArg
     * @returns {string}
     * @see https://people.mozilla.org/~jorendorff/es6-draft.html#sec-tostring
     */
    function $toString(inputArg) {
        var type,
            val;

        if (inputArg === null) {
            val = 'null';
        } else {
            type = typeof inputArg;
            if (type === 'string') {
                val = inputArg;
            } else if (type === 'undefined') {
                val = type;
            } else {
                if (type === 'symbol') {
                    throw new TypeError('Cannot convert symbol to string');
                }

                val = String(inputArg);
            }
        }

        return val;
    }

    /**
     * Returns a string only if the arguments is coercible otherwise throws an
     * error.
     *
     * @private
     * @function
     * @param {*} inputArg
     * @throws {TypeError} If inputArg is null or undefined.
     * @returns {string}
     */
    function $onlyCoercibleToString(inputArg) {
        return $toString($requireObjectCoercible(inputArg));
    }

    /**
     * The function evaluates the passed value and converts it to an integer.
     *
     * @private
     * @function
     * @param {*} inputArg The object to be converted to an integer.
     * @returns {number} If the target value is NaN, null or undefined, 0 is
     *                   returned. If the target value is false, 0 is returned
     *                   and if true, 1 is returned.
     * @see http://www.ecma-international.org/ecma-262/5.1/#sec-9.4
     */
    function $toInteger(inputArg) {
        var number = +inputArg,
            val = 0;

        if ($strictEqual(number, number)) {
            if (!number || number === Infinity || number === -Infinity) {
                val = number;
            } else {
                val = (number > 0 || -1) * Math.floor(Math.abs(number));
            }
        }

        return val;
    }

    /**
     * Copies a regex object. Allows adding and removing native flags while
     * copying the regex.
     *
     * @private
     * @function
     * @param {RegExp} regex Regex to copy.
     * @param {Object} [options] Allows specifying native flags to add or
     *                           remove while copying the regex.
     * @returns {RegExp} Copy of the provided regex, possibly with modified
     *                   flags.
     */
    function $copyRegExp(regex, options) {
        var flags,
            opts,
            rx;

        if (options !== null && typeof options === 'object') {
            opts = options;
        } else {
            opts = {};
        }

        // Get native flags in use
        flags = getNativeFlags.exec($toString(regex))[1];
        flags = $onlyCoercibleToString(flags);
        if (opts.add) {
            flags += opts.add;
            flags = flags.replace(clipDups, '');
        }

        if (opts.remove) {
            // Would need to escape `options.remove` if this was public
            rx = new RegExp('[' + opts.remove + ']+', 'g');
            flags = flags.replace(rx, '');
        }

        return new RegExp(regex.source, flags);
    }

    /**
     * The abstract operation ToLength converts its argument to an integer
     * suitable for use as the length of an array-like object.
     *
     * @private
     * @function
     * @param {*} inputArg The object to be converted to a length.
     * @returns {number} If len <= +0 then +0 else if len is +INFINITY then
     *                   2^53-1 else min(len, 2^53-1).
     * @see https://people.mozilla.org/~jorendorff/es6-draft.html#sec-tolength
     */
    function $toLength(inputArg) {
        return Math.min(Math.max($toInteger(inputArg), 0), MAX_SAFE_INTEGER);
    }

    /**
     * Copies a regex object so that it is suitable for use with searchOf and
     * searchLastOf methods.
     *
     * @private
     * @function
     * @param {RegExp} regex Regex to copy.
     * @returns {RegExp}
     */
    function $toSearchRegExp(regex) {
        return $copyRegExp(regex, {
            add: 'g',
            remove: 'y'
        });
    }

    /**
     * Returns true if the operand inputArg is a member of one of the types
     * Undefined, Null, Boolean, Number, Symbol, or String.
     *
     * @private
     * @function
     * @param {*} inputArg
     * @returns {boolean}
     * @see https://goo.gl/W68ywJ
     * @see https://goo.gl/ev7881
     */
    function $isPrimitive(inputArg) {
        var type = typeof inputArg;

        return type === 'undefined' ||
                inputArg === null ||
                type === 'boolean' ||
                type === 'string' ||
                type === 'number' ||
                type === 'symbol';
    }

    /**
     * The abstract operation converts its argument to a value of type Object
     * but fixes some environment bugs.
     *
     * @private
     * @function
     * @param {*} inputArg The argument to be converted to an object.
     * @throws {TypeError} If inputArg is not coercible to an object.
     * @returns {Object} Value of inputArg as type Object.
     * @see http://www.ecma-international.org/ecma-262/5.1/#sec-9.9
     */
    function $toObject(inputArg) {
        var object;

        if ($isPrimitive($requireObjectCoercible(inputArg))) {
            object = Object(inputArg);
        } else {
            object = inputArg;
        }

        return object;
    }

    /**
     * Converts a single argument that is an array-like object or list (eg.
     * arguments, NodeList, DOMTokenList (used by classList), NamedNodeMap
     * (used by attributes property)) into a new Array() and returns it.
     * This is a partial implementation of the ES6 Array.from
     *
     * @private
     * @function
     * @param {Object} arrayLike
     * @returns {Array}
     */
    function $toArray(arrayLike) {
        var object = $toObject(arrayLike),
            length = $toLength(object.length),
            array = [],
            index = 0;

        array.length = length;
        while (index < length) {
            array[index] = object[index];
            index += 1;
        }

        return array;
    }

    if (!String.prototype.searchOf) {
        /**
         * This method returns the index within the calling String object of
         * the first occurrence of the specified value, starting the search at
         * fromIndex. Returns -1 if the value is not found.
         *
         * @function
         * @this {string}
         * @param {RegExp|string} regex A regular expression object or a String.
         *                              Anything else is implicitly converted to
         *                              a String.
         * @param {Number} [fromIndex] The location within the calling string
         *                             to start the search from. It can be any
         *                             integer. The default value is 0. If
         *                             fromIndex < 0 the entire string is
         *                             searched (same as passing 0). If
         *                             fromIndex >= str.length, the method will
         *                             return -1 unless searchValue is an empty
         *                             string in which case str.length is
         *                             returned.
         * @returns {Number} If successful, returns the index of the first
         *                   match of the regular expression inside the
         *                   string. Otherwise, it returns -1.
         */
        $defineProperty(String.prototype, 'searchOf', {
            enumerable: false,
            configurable: true,
            writable: true,
            value: function (regex) {
                var str = $onlyCoercibleToString(this),
                    args = $toArray(arguments),
                    result = -1,
                    fromIndex,
                    match,
                    rx;

                if (!$isRegExp(regex)) {
                    return String.prototype.indexOf.apply(str, args);
                }

                if ($toLength(args.length) > 1) {
                    fromIndex = +args[1];
                    if (fromIndex < 0) {
                        fromIndex = 0;
                    }
                } else {
                    fromIndex = 0;
                }

                if (fromIndex >= $toLength(str.length)) {
                    return result;
                }

                rx = $toSearchRegExp(regex);
                rx.lastIndex = fromIndex;
                match = rx.exec(str);
                if (match) {
                    result = +match.index;
                }

                return result;
            }
        });
    }

    if (!String.prototype.searchLastOf) {
        /**
         * This method returns the index within the calling String object of
         * the last occurrence of the specified value, or -1 if not found.
         * The calling string is searched backward, starting at fromIndex.
         *
         * @function
         * @this {string}
         * @param {RegExp|string} regex A regular expression object or a String.
         *                              Anything else is implicitly converted to
         *                              a String.
         * @param {Number} [fromIndex] Optional. The location within the
         *                             calling string to start the search at,
         *                             indexed from left to right. It can be
         *                             any integer. The default value is
         *                             str.length. If it is negative, it is
         *                             treated as 0. If fromIndex > str.length,
         *                             fromIndex is treated as str.length.
         * @returns {Number} If successful, returns the index of the first
         *                   match of the regular expression inside the
         *                   string. Otherwise, it returns -1.
         */
        $defineProperty(String.prototype, 'searchLastOf', {
            enumerable: false,
            configurable: true,
            writable: true,
            value: function (regex) {
                var str = $onlyCoercibleToString(this),
                    args = $toArray(arguments),
                    result = -1,
                    fromIndex,
                    length,
                    match,
                    pos,
                    rx;

                if (!$isRegExp(regex)) {
                    return String.prototype.lastIndexOf.apply(str, args);
                }

                length = $toLength(str.length);
                if (!$strictEqual(args[1], args[1])) {
                    fromIndex = length;
                } else {
                    if ($toLength(args.length) > 1) {
                        fromIndex = $toInteger(args[1]);
                    } else {
                        fromIndex = length - 1;
                    }
                }

                if (fromIndex >= 0) {
                    fromIndex = Math.min(fromIndex, length - 1);
                } else {
                    fromIndex = length - Math.abs(fromIndex);
                }

                pos = 0;
                rx = $toSearchRegExp(regex);
                while (pos <= fromIndex) {
                    rx.lastIndex = pos;
                    match = rx.exec(str);
                    if (!match) {
                        break;
                    }

                    pos = +match.index;
                    if (pos <= fromIndex) {
                        result = pos;
                    }

                    pos += 1;
                }

                return result;
            }
        });
    }
}());

(function () {
    'use strict';

    /*
     * testing as follow to make sure that at least for one character regexp,
     * the result is the same as if we used indexOf
     */

    var pre = document.getElementById('out');

    function log(result) {
        pre.appendChild(document.createTextNode(result + '\n'));
    }

    function test(str) {
        var i = str.length + 2,
            r,
            a,
            b;

        while (i) {
            a = str.indexOf('a', i);
            b = str.searchOf(/a/, i);
            r = ['Failed', 'searchOf', str, i, a, b];
            if (a === b) {
                r[0] = 'Passed';
            }

            log(r);
            a = str.lastIndexOf('a', i);
            b = str.searchLastOf(/a/, i);
            r = ['Failed', 'searchLastOf', str, i, a, b];
            if (a === b) {
                r[0] = 'Passed';
            }

            log(r);
            i -= 1;
        }
    }

    /*
     * Look for the a among the xes
     */

    test('xxx');
    test('axx');
    test('xax');
    test('xxa');
    test('axa');
    test('xaa');
    test('aax');
    test('aaa');
}());
<pre id="out"></pre>


0

RegExpを使用した非常に単純なlastIndexルックアップを探していて、lastIndexOfを最後の詳細まで模倣しているかどうかは気にしない場合、これは注意を引くかもしれません。

文字列を逆にし、長さ-1から最初の出現インデックスを引くだけです。たまたまテストに合格しましたが、長い文字列ではパフォーマンスの問題が発生する可能性があると思います。

interface String {
  reverse(): string;
  lastIndex(regex: RegExp): number;
}

String.prototype.reverse = function(this: string) {
  return this.split("")
    .reverse()
    .join("");
};

String.prototype.lastIndex = function(this: string, regex: RegExp) {
  const exec = regex.exec(this.reverse());
  return exec === null ? -1 : this.length - 1 - exec.index;
};

0

String.prototype.match(regex)文字列で指定さregexれたものと一致するすべての一致の文字列配列を返すを使用 しました(詳細はこちらを参照):

function getLastIndex(text, regex, limit = text.length) {
  const matches = text.match(regex);

  // no matches found
  if (!matches) {
    return -1;
  }

  // matches found but first index greater than limit
  if (text.indexOf(matches[0] + matches[0].length) > limit) {
    return -1;
  }

  // reduce index until smaller than limit
  let i = matches.length - 1;
  let index = text.lastIndexOf(matches[i]);
  while (index > limit && i >= 0) {
    i--;
    index = text.lastIndexOf(matches[i]);
  }
  return index > limit ? -1 : index;
}

// expect -1 as first index === 14
console.log(getLastIndex('First Sentence. Last Sentence. Unfinished', /\. /g, 10));

// expect 29
console.log(getLastIndex('First Sentence. Last Sentence. Unfinished', /\. /g));


0
var mystring = "abc ab a";
var re  = new RegExp("ab"); // any regex here

if ( re.exec(mystring) != null ){ 
   alert("matches"); // true in this case
}

標準の正規表現を使用します。

var re  = new RegExp("^ab");  // At front
var re  = new RegExp("ab$");  // At end
var re  = new RegExp("ab(c|d)");  // abc or abd

-2

まあ、あなたは単にキャラクターの位置を一致させようとしているだけので、正規表現は多分やり過ぎです。

必要なのは、「この文字の最初に見つける」の代わりに、これらの文字の最初を見つけることだけだと思います。

もちろん、これは簡単な答えですが、正規表現の部分がなくても、質問で設定したことを実行します(具体的には正規表現である必要がある理由を明確にしていないため)。

function mIndexOf( str , chars, offset )
{
   var first  = -1; 
   for( var i = 0; i < chars.length;  i++ )
   {
      var p = str.indexOf( chars[i] , offset ); 
      if( p < first || first === -1 )
      {
           first = p;
      }
   }
   return first; 
}
String.prototype.mIndexOf = function( chars, offset )
{
   return mIndexOf( this, chars, offset ); # I'm really averse to monkey patching.  
};
mIndexOf( "hello world", ['a','o','w'], 0 );
>> 4 
mIndexOf( "hello world", ['a'], 0 );
>> -1 
mIndexOf( "hello world", ['a','o','w'], 4 );
>> 4
mIndexOf( "hello world", ['a','o','w'], 5 );
>> 6
mIndexOf( "hello world", ['a','o','w'], 7 );
>> -1 
mIndexOf( "hello world", ['a','o','w','d'], 7 );
>> 10
mIndexOf( "hello world", ['a','o','w','d'], 10 );
>> 10
mIndexOf( "hello world", ['a','o','w','d'], 11 );
>> -1

モンキーパッチについてのコメント-私はその問題を認識していますが、グローバルネームスペースを汚染する方が良いと思いますか?どちらの場合もシンボルの競合が発生する可能性はなく、問題が発生した場合に基本的に同じ方法でリファクタリング/修復されます。
Peter Bailey、

さて、\ sと場合によっては\ Wを検索する必要があり、すべての可能性を列挙する必要がないことを望んでいました。
パット

BaileyP:名前空間を汚染することなくこの問題を回避できます。つまり、jQueryなどを参照してください。そのモデルを使用します。プロジェクトの1つのオブジェクト。Mootoolsは私の口に悪い味を残しました。
ケントフレドリック

また、私が書いたようなコードは決して作成しません。この例は、ユースケースの理由から簡略化されています。
ケントフレドリック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.