PHPでブラウザー言語を検出する


144

次のPHPスクリプトを自分のウェブサイトのインデックスとして使用しています。

このスクリプトには、ブラウザの言語に応じて特定のページを含める必要があります(自動的に検出されます)。

このスクリプトはすべてのブラウザーでうまく機能しないindex_en.phpため、検出されたすべての言語が常に含まれます(問題の原因は、おそらくAccept-Languageヘッダーが考慮されていないことによる問題です)。

より堅牢なソリューションを提案していただけませんか?

<?php
// Open session var
session_start();
// views: 1 = first visit; >1 = second visit

// Detect language from user agent browser
function lixlpixel_get_env_var($Var)
{
     if(empty($GLOBALS[$Var]))
     {
         $GLOBALS[$Var]=(!empty($GLOBALS['_SERVER'][$Var]))?
         $GLOBALS['_SERVER'][$Var] : (!empty($GLOBALS['HTTP_SERVER_VARS'][$Var])) ? $GLOBALS['HTTP_SERVER_VARS'][$Var]:'';
     }
}

function lixlpixel_detect_lang()
{
     // Detect HTTP_ACCEPT_LANGUAGE & HTTP_USER_AGENT.
     lixlpixel_get_env_var('HTTP_ACCEPT_LANGUAGE');
     lixlpixel_get_env_var('HTTP_USER_AGENT');

     $_AL=strtolower($GLOBALS['HTTP_ACCEPT_LANGUAGE']);
     $_UA=strtolower($GLOBALS['HTTP_USER_AGENT']);

     // Try to detect Primary language if several languages are accepted.
     foreach($GLOBALS['_LANG'] as $K)
     {
         if(strpos($_AL, $K)===0)
         return $K;
     }

     // Try to detect any language if not yet detected.
     foreach($GLOBALS['_LANG'] as $K)
     {
         if(strpos($_AL, $K)!==false)
         return $K;
     }
     foreach($GLOBALS['_LANG'] as $K)
     {
         //if(preg_match("/[[( ]{$K}[;,_-)]/",$_UA)) // matching other letters (create an error for seo spyder)
         return $K;
     }

     // Return default language if language is not yet detected.
     return $GLOBALS['_DLANG'];
}

// Define default language.
$GLOBALS['_DLANG']='en';

// Define all available languages.
// WARNING: uncomment all available languages

$GLOBALS['_LANG'] = array(
'af', // afrikaans.
'ar', // arabic.
'bg', // bulgarian.
'ca', // catalan.
'cs', // czech.
'da', // danish.
'de', // german.
'el', // greek.
'en', // english.
'es', // spanish.
'et', // estonian.
'fi', // finnish.
'fr', // french.
'gl', // galician.
'he', // hebrew.
'hi', // hindi.
'hr', // croatian.
'hu', // hungarian.
'id', // indonesian.
'it', // italian.
'ja', // japanese.
'ko', // korean.
'ka', // georgian.
'lt', // lithuanian.
'lv', // latvian.
'ms', // malay.
'nl', // dutch.
'no', // norwegian.
'pl', // polish.
'pt', // portuguese.
'ro', // romanian.
'ru', // russian.
'sk', // slovak.
'sl', // slovenian.
'sq', // albanian.
'sr', // serbian.
'sv', // swedish.
'th', // thai.
'tr', // turkish.
'uk', // ukrainian.
'zh' // chinese.
);

// Redirect to the correct location.
// Example Implementation aff var lang to name file
/*
echo 'The Language detected is: '.lixlpixel_detect_lang(); // For Demonstration
echo "<br />";    
*/
$lang_var = lixlpixel_detect_lang(); //insert lang var system in a new var for conditional statement
/*
echo "<br />";    

echo $lang_var; // print var for trace

echo "<br />";    
*/
// Insert the right page iacoording with the language in the browser
switch ($lang_var){
    case "fr":
        //echo "PAGE DE";
        include("index_fr.php");//include check session DE
        break;
    case "it":
        //echo "PAGE IT";
        include("index_it.php");
        break;
    case "en":
        //echo "PAGE EN";
        include("index_en.php");
        break;        
    default:
        //echo "PAGE EN - Setting Default";
        include("index_en.php");//include EN in all other cases of different lang detection
        break;
}
?>

3
PHP 5.3.0以降にはlocale_accept_from_http()Accept-Languageヘッダーから優先言語を取得するものが付属しています。このメソッドは常に自己記述メソッドよりも優先する必要があります。試行した正規表現のリストに対して結果を確認し、ページ言語をそのように決定します。例については、PHP-I18Nを参照してください。
2014

2
問題は、locale_accept_from_http()あなたがまだ持っているので、それを返し最良の結果サポートしていない可能性があることを、解析にヘッダを自分で見つけることが次善のを
Xeoncross

これに対する受け入れられた答えは、複数の言語を考慮に入れるものの1つに変更する必要があります。
ペッカ

includeおよびrequireはphpのコンパイル時に行われるため、基本的にはすべてのindex * .phpを含めて1つだけを表示します-リソースの無駄
Michael

回答:


361

なぜあなたはそれをシンプルでクリーンに保つのですか

<?php
    $lang = substr($_SERVER['HTTP_ACCEPT_LANGUAGE'], 0, 2);
    $acceptLang = ['fr', 'it', 'en']; 
    $lang = in_array($lang, $acceptLang) ? $lang : 'en';
    require_once "index_{$lang}.php"; 

?>

9
オランダ語、ギリシャ語、スロベニア語の言語コードは1文字です。:このように爆発した方が良いようですphp.net/manual/tr/reserved.variables.server.php#90293
trante

10
@trante:なぜあなたはそれらが1文字であると言うのですか?オランダ語(nl)、ギリシャ語(el)、スロベニア語(sl)はすべて2文字のように見えます:msdn.microsoft.com/en-us/library/ms533052(v
Peter K.

16
このコードはリスト全体を調べません。言語リストでpl最優先でfr2番目の場合はどうなりますか?フランス語ではなく英語を取得します。
Kos

24
これは、優先順位を検出欠き、コードとis'nt互換二文字とは異なる
アクセルコスタスペナ

3
2文字以外の長さはありません!お気に入りのブラウザーで言語の優先順位を変更すると、それが表示されます。
Gigala 2013

76

Accept-Languageは、重み付けされた値のリストです( qパラメーターを参照)。つまり、最初の言語を見ただけでは、最初の言語が最も好ましいというわけではありません。実際、 q値が0の場合、まったく受け入れられません。

したがって、最初の言語だけを見るのではなく、受け入れられている言語と使用可能な言語のリストを解析して、最適な一致を見つけます。

// parse list of comma separated language tags and sort it by the quality value
function parseLanguageList($languageList) {
    if (is_null($languageList)) {
        if (!isset($_SERVER['HTTP_ACCEPT_LANGUAGE'])) {
            return array();
        }
        $languageList = $_SERVER['HTTP_ACCEPT_LANGUAGE'];
    }
    $languages = array();
    $languageRanges = explode(',', trim($languageList));
    foreach ($languageRanges as $languageRange) {
        if (preg_match('/(\*|[a-zA-Z0-9]{1,8}(?:-[a-zA-Z0-9]{1,8})*)(?:\s*;\s*q\s*=\s*(0(?:\.\d{0,3})|1(?:\.0{0,3})))?/', trim($languageRange), $match)) {
            if (!isset($match[2])) {
                $match[2] = '1.0';
            } else {
                $match[2] = (string) floatval($match[2]);
            }
            if (!isset($languages[$match[2]])) {
                $languages[$match[2]] = array();
            }
            $languages[$match[2]][] = strtolower($match[1]);
        }
    }
    krsort($languages);
    return $languages;
}

// compare two parsed arrays of language tags and find the matches
function findMatches($accepted, $available) {
    $matches = array();
    $any = false;
    foreach ($accepted as $acceptedQuality => $acceptedValues) {
        $acceptedQuality = floatval($acceptedQuality);
        if ($acceptedQuality === 0.0) continue;
        foreach ($available as $availableQuality => $availableValues) {
            $availableQuality = floatval($availableQuality);
            if ($availableQuality === 0.0) continue;
            foreach ($acceptedValues as $acceptedValue) {
                if ($acceptedValue === '*') {
                    $any = true;
                }
                foreach ($availableValues as $availableValue) {
                    $matchingGrade = matchLanguage($acceptedValue, $availableValue);
                    if ($matchingGrade > 0) {
                        $q = (string) ($acceptedQuality * $availableQuality * $matchingGrade);
                        if (!isset($matches[$q])) {
                            $matches[$q] = array();
                        }
                        if (!in_array($availableValue, $matches[$q])) {
                            $matches[$q][] = $availableValue;
                        }
                    }
                }
            }
        }
    }
    if (count($matches) === 0 && $any) {
        $matches = $available;
    }
    krsort($matches);
    return $matches;
}

// compare two language tags and distinguish the degree of matching
function matchLanguage($a, $b) {
    $a = explode('-', $a);
    $b = explode('-', $b);
    for ($i=0, $n=min(count($a), count($b)); $i<$n; $i++) {
        if ($a[$i] !== $b[$i]) break;
    }
    return $i === 0 ? 0 : (float) $i / count($a);
}

$accepted = parseLanguageList($_SERVER['HTTP_ACCEPT_LANGUAGE']);
var_dump($accepted);
$available = parseLanguageList('en, fr, it');
var_dump($available);
$matches = findMatches($accepted, $available);
var_dump($matches);

findMatchesが空の配列を返す場合、一致するものが見つからなかったため、デフォルトの言語を使用できます。


こんにちは、スクリプトは問題なく動作していたため、停止しました。サーバーのSESSIONがオフになっている場合、このスクリプトが機能しない可能性がありますか?
GibboK 2010

@GIbboK:いいえ、これはセッションとは無関係です。
ガンボ

正しいが、@ diggersworldソリューションを好む...コードの記述を減らす
lrkwz

誰かが私に価値がどのようにq決まっているのか教えていただけますか ありがとう
Phantom007

@ Phantom007設定の依存:0 =この言語は不要、1 =常にこの言語が必要。
Skyost

43

既存の答えは少し冗長すぎるので、この小さい自動マッチングバージョンを作成しました。

function prefered_language(array $available_languages, $http_accept_language) {

    $available_languages = array_flip($available_languages);

    $langs;
    preg_match_all('~([\w-]+)(?:[^,\d]+([\d.]+))?~', strtolower($http_accept_language), $matches, PREG_SET_ORDER);
    foreach($matches as $match) {

        list($a, $b) = explode('-', $match[1]) + array('', '');
        $value = isset($match[2]) ? (float) $match[2] : 1.0;

        if(isset($available_languages[$match[1]])) {
            $langs[$match[1]] = $value;
            continue;
        }

        if(isset($available_languages[$a])) {
            $langs[$a] = $value - 0.1;
        }

    }
    arsort($langs);

    return $langs;
}

そしてサンプルの使用法:

//$_SERVER["HTTP_ACCEPT_LANGUAGE"] = 'en-us,en;q=0.8,es-cl;q=0.5,zh-cn;q=0.3';

// Languages we support
$available_languages = array("en", "zh-cn", "es");

$langs = prefered_language($available_languages, $_SERVER["HTTP_ACCEPT_LANGUAGE"]);

/* Result
Array
(
    [en] => 0.8
    [es] => 0.4
    [zh-cn] => 0.3
)*/

完全な要旨のソースはこちら


6
これは素晴らしく、まさに今日の特定のプロジェクトに必要なものです。私が行った唯一の追加は、関数がデフォルトの言語を受け入れて、使用可能な言語とHTTP_ACCEPT_LANGUAGEとの間に一致がない場合はそれにフォールバックできるようにすることです。
スコット

7
ああ、私の変更の要点はここにあります:gist.github.com/humantorch/d255e39a8ab4ea2e7005(簡単にするために1つのファイルにまとめました)
Scott

2
とてもいい方法です!$ langsにすでに言語のエントリが含まれているかどうかを確認する必要があります。enferred言語がen-US、2番目のde、3番目のenであることが私に起こりました。あなたの方法は常に私にdeを与えました。原因はenの最初の値が3番目のエントリによって上書きされたためです
Peter Pint

また、一致するものが見つからない場合は、PHP警告が生成されます。これを優雅に扱うといいでしょう。
Simon East

26

これを処理する公式の方法は、PECL HTTPライブラリを使用することです。ここでのいくつかの回答とは異なり、これは言語の優先順位(q値)、部分的な言語の一致を正しく処理し、最も近い一致を返します。一致がない場合は、配列の最初の言語にフォールバックします。

PECL HTTP:http :
//pecl.php.net/package/pecl_http

使用方法:http :
//php.net/manual/fa/function.http-negotiate-language.php

$supportedLanguages = [
    'en-US', // first one is the default/fallback
    'fr',
    'fr-FR',
    'de',
    'de-DE',
    'de-AT',
    'de-CH',
];

// Returns the negotiated language 
// or the default language (i.e. first array entry) if none match.
$language = http_negotiate_language($supportedLanguages, $result);

1
機能するリンクを見つけたので、それを含めるように回答を更新しました。
Simon East

これらの3つのリンクはすべて停止しているように見え、Googleで簡単にインストールできる手順はないようです(この機能は、そのページに従って非推奨になっています)
ブライアンリーシュマン

11

上記の選択された回答の問題は、ユーザーが最初の選択肢をケース構造にない言語として設定している可能性があるが、他の言語の選択肢の1つが設定されていることです。一致が見つかるまでループする必要があります。

これは、より簡単に機能する非常にシンプルなソリューションです。ブラウザは言語を優先順に返すので、問題が簡単になります。言語指定子は3文字以上(たとえば、 "EN-US")にすることができますが、通常は最初の2文字で十分です。次のコード例では、プログラムが認識している既知の言語のリストから一致するものを探しています。

$known_langs = array('en','fr','de','es');
$user_pref_langs = explode(',', $_SERVER['HTTP_ACCEPT_LANGUAGE']);

foreach($user_pref_langs as $idx => $lang) {
    $lang = substr($lang, 0, 2);
    if (in_array($lang, $known_langs)) {
        echo "Preferred language is $lang";
        break;
    }
}

これが、コードで簡単に使用できる迅速でシンプルなソリューションであることを願っています。私はかなり長い間、これをプロダクションで使用しています。


3
「ブラウザは優先順に言語を返します」—そうするかもしれませんが、それに依存するべきではありません。q値を使用して設定を決定します。仕様では、このようにする必要があります。
クエンティン2016年

7

これを試してください:

#########################################################
# Copyright © 2008 Darrin Yeager                        #
# https://www.dyeager.org/                               #
# Licensed under BSD license.                           #
#   https://www.dyeager.org/downloads/license-bsd.txt    #
#########################################################

function getDefaultLanguage() {
   if (isset($_SERVER["HTTP_ACCEPT_LANGUAGE"]))
      return parseDefaultLanguage($_SERVER["HTTP_ACCEPT_LANGUAGE"]);
   else
      return parseDefaultLanguage(NULL);
   }

function parseDefaultLanguage($http_accept, $deflang = "en") {
   if(isset($http_accept) && strlen($http_accept) > 1)  {
      # Split possible languages into array
      $x = explode(",",$http_accept);
      foreach ($x as $val) {
         #check for q-value and create associative array. No q-value means 1 by rule
         if(preg_match("/(.*);q=([0-1]{0,1}.\d{0,4})/i",$val,$matches))
            $lang[$matches[1]] = (float)$matches[2];
         else
            $lang[$val] = 1.0;
      }

      #return default language (highest q-value)
      $qval = 0.0;
      foreach ($lang as $key => $value) {
         if ($value > $qval) {
            $qval = (float)$value;
            $deflang = $key;
         }
      }
   }
   return strtolower($deflang);
}

ねえ、q値をキャッチするべき正規表現を説明できます[0-1]{0,1}.\d{0,4}か?まず私はあなた\..正しいのではなくということですか?そして、qは常に形式0.1324か何かではありませんか?それでそれを書くことで十分ではないでしょう0\.?\d{0,4}か?持っている場合q=1.0は、else部分に進むことができます。
アダム

ここでの使用例を見ていただければ幸いです。
Simon East

2
@SimonEast var_dump( getDefaultLanguage());
ジラリウム

4

次のスクリプトは、サポートされている言語と一致する言語がない場合、またはデフォルトの言語設定を新しい言語設定に置き換える場合、デフォルトの言語設定にフォールバックするXeoncrossのコードの修正バージョン(そのXeoncrossをありがとう)です。言語の優先順位に応じて。

このシナリオでは、ユーザーのブラウザーはスペイン語、オランダ語、米国英語、英語の優先順位で設定され、アプリケーションは英語とオランダ語のみをサポートし、地域のバリエーションはなく、英語がデフォルトの言語です。"HTTP_ACCEPT_LANGUAGE"文字列内の値の順序は、ブラウザが何らかの理由で値を正しく順序付けていない場合は重要ではありません。

$supported_languages = array("en","nl");
$supported_languages = array_flip($supported_languages);
var_dump($supported_languages); // array(2) { ["en"]=> int(0) ["nl"]=> int(1) }

$http_accept_language = $_SERVER["HTTP_ACCEPT_LANGUAGE"]; // es,nl;q=0.8,en-us;q=0.5,en;q=0.3

preg_match_all('~([\w-]+)(?:[^,\d]+([\d.]+))?~', strtolower($http_accept_language), $matches, PREG_SET_ORDER);

$available_languages = array();

foreach ($matches as $match)
{
    list($language_code,$language_region) = explode('-', $match[1]) + array('', '');

    $priority = isset($match[2]) ? (float) $match[2] : 1.0;

    $available_languages[][$language_code] = $priority;
}

var_dump($available_languages);

/*
array(4) {
    [0]=>
    array(1) {
        ["es"]=>
        float(1)
    }
    [1]=>
    array(1) {
        ["nl"]=>
        float(0.8)
    }
    [2]=>
    array(1) {
        ["en"]=>
        float(0.5)
    }
    [3]=>
    array(1) {
        ["en"]=>
        float(0.3)
    }
}
*/

$default_priority = (float) 0;
$default_language_code = 'en';

foreach ($available_languages as $key => $value)
{
    $language_code = key($value);
    $priority = $value[$language_code];

    if ($priority > $default_priority && array_key_exists($language_code,$supported_languages))
    {
        $default_priority = $priority;
        $default_language_code = $language_code;

        var_dump($default_priority); // float(0.8)
        var_dump($default_language_code); // string(2) "nl"
    }
}

var_dump($default_language_code); // string(2) "nl" 

1

一番綺麗なのはこれだと思います!

 <?php
  $lang = substr($_SERVER['HTTP_ACCEPT_LANGUAGE'], 0, 2);
  $supportedLanguages=['en','fr','gr'];
  if(!in_array($lang,$supportedLanguages)){
     $lang='en';
  }
    require("index_".$lang.".php");

これは、ヘッダー内の言語の優先順位を考慮していません。
Simon East

0

上記のすべてを「en」にフォールバック:

$lang = substr(explode(',',$_SERVER['HTTP_ACCEPT_LANGUAGE'])[0],0,2)?:'en';

...またはデフォルトの言語フォールバックと既知の言語配列:

function lang( $l = ['en'], $u ){
    return $l[
        array_keys(
            $l,
            substr(
                explode(
                    ',',
                    $u ?: $_SERVER['HTTP_ACCEPT_LANGUAGE']
                )[0],
                0,
                2
            )
        )[0]
    ] ?: $l[0];
}

1行:

function lang($l=['en'],$u){return $l[array_keys($l,substr(explode(',',$u?:$_SERVER['HTTP_ACCEPT_LANGUAGE'])[0],0,2))[0]]?:$l[0];}

例:

// first known lang is always default
$_SERVER['HTTP_ACCEPT_LANGUAGE'] = 'en-us';
lang(['de']); // 'de'
lang(['de','en']); // 'en'

// manual set accept-language
lang(['de'],'en-us'); // 'de'
lang(['de'],'de-de, en-us'); // 'de'
lang(['en','fr'],'de-de, en-us'); // 'en'
lang(['en','fr'],'fr-fr, en-us'); // 'fr'
lang(['de','en'],'fr-fr, en-us'); // 'de'

0

試して、

$lang = substr($_SERVER['HTTP_ACCEPT_LANGUAGE'], 0,2);

if ($lang == 'tr') {
include_once('include/language/tr.php');
}elseif ($lang == 'en') {
include_once('include/language/en.php');
}elseif ($lang == 'de') {
include_once('include/language/de.php');
}elseif ($lang == 'fr') {
include_once('include/language/fr.php');
}else{
include_once('include/language/tr.php');
}

のおかげで


0

すばやく簡単:

$language = trim(substr( strtok(strtok($_SERVER['HTTP_ACCEPT_LANGUAGE'], ','), ';'), 0, 5));

注:最初の言語コードはブラウザで使用されているもので、残りはユーザーがブラウザで設定した他の言語です。

一部の言語には地域コードがあります。en-GB、その他は言語コードのみを持っています。sk。

地域ではなく言語のみが必要な場合(例:en、fr、esなど)、以下を使用できます。

$language =substr($_SERVER['HTTP_ACCEPT_LANGUAGE'], 0, 2);

-1

これはクッキーをセットするものです。ご覧のとおり、最初にユーザーが言語を投稿したかどうかを確認します。なぜなら、ブラウザの言語は常にユーザーについて教えているわけではないからです。

<?php   
    $lang = getenv("HTTP_ACCEPT_LANGUAGE");
    $set_lang = explode(',', $lang);
    if (isset($_POST['lang'])) 
        {
            $taal = $_POST['lang'];
            setcookie("lang", $taal);
            header('Location: /p/');
        }
    else 
        {
            setcookie("lang", $set_lang[0]);
            echo $set_lang[0];
            echo '<br>';
            echo $set_lang[1];
            header('Location: /p/');
        } 
?>

11
すでにエコーしている場合は、ヘッダーを送信できないと思いますか?

2
この投稿の背後にあるインデントは意味があると思います。これは、ユーザーに言語を切り替える方法を提供し、この決定を思い出すことです。言語検出は、最初の選択を最もよく推測するために1回だけ行う必要があります。
danijar 2013年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.