Rを学びましたが、企業はSASの経験にもっと興味があるようです。Rに対するSASの利点は何ですか?
Rを学びましたが、企業はSASの経験にもっと興味があるようです。Rに対するSASの利点は何ですか?
回答:
私はいくつかの問題があると思います(有効性の昇順で):
個人的には、Rで開発されたビッグデータへのアプローチはありますが、#3には正当なメリットがあると思います。#2はいくつかの事実を無視していると思います:Rで行われているいくつかの審査があり、主要なパッケージの多くは統計の最大の名前のいくつかによって書かれており、異なる統計ソフトウェアとRの精度を比較する研究があります確かに競争力がありました。
lme4
メーリングリストをフォローすると、SASとの比較がかなり定期的に行われていることがわかります。しかし、そのような比較を行うべきかどうかを知ることは不可能です。ソースにアクセスできない場合、ソフトウェアによって生成された結果が実際に有効であるという言葉でそれらの企業をとらなければなりません。率直に言って、私は使用しているソフトウェアコードをレビューする能力を持っていることを好みます。
これまでの良い答えに加えて、私は恥ずかしさの要因を追加します。昨年、SASおよびSASサポートに数十万ドルを費やし、Rには何も費やさず、サポート価格が非常に低い(革命など)場合、チェーンの上位の誰かがその理由を尋ねます。昨年Rが存在したときに、去年そんなにお金を使うのは間違いだったのですか?それとも、ボランティアのグループによって作成されたもののためにプロのソフトウェアをドロップするのは間違いですか?
問題がそのように組み立てられると、それは負けの命題なので、たぶんそれを持ち出さないほうが良いでしょう。
ここで gungが正しく識別したものの上に、企業の世界で最大の問題はレガシーです。そして、あなたが仕事をすることが知られている良質の生産コードを持っているとき、あなたはそれを変更しません。SASは1970年代から存在していましたが、当時はSASが唯一の効果的なスクリプト言語のスクリプトでした。それ以降、製薬および政府のSASに蓄積された生産コードの量は想像を絶するものであり、数十年の人間の年です。RまたはStataでこれを書き換えるには数年かかり、結果のコードはより柔軟で、効率的で、透明性が高く、保守が簡単で安価になりますが、そのようなリファクタリングの費用はかかりません。(これを行う私の経験では、Stataコードは一般に約3倍短くなります。SPSSコードをStataに変換するプロジェクトで、約20倍短くしました。
ある意味では、これは学術出版社と同様の話です。彼らは、エンドユーザーの流れに乗って、サブスクリプションを不必要に維持しています。Natureのサブスクリプションがない大学は、実際には大学ではありません。専門家団体による無料公開は、より安価になり、人々は最近LaTeXで提出物を準備するので、彼らはカメラの準備ができており、同じ人々がピアレビューを提供するので、どの次元でも品質の後退はありません。しかし......オンラインジャーナルの背後にはブランド名とインパクトファクターはありません。
これはすべてをまとめたものです:http : //scatter.wordpress.com/2011/06/28/stata-12/。Stataは経済学や政策関連の分野で好まれており、SASを学ぶほどStataが好きになります。
私は過去7年間、SASプログラマーとして効果的に仕事をしてきました。私の隣で同僚が私よりも長くSASをプログラミングしてきました。ここで述べたように、SASの背後には大量の慣性/レガシーがあります。しかし、RのようなSASは手段への道であり、手段そのものではありません。
SASは、シーケンシャルデータアクセスで非常に効率的であり、SQLを介したデータベースアクセスは非常によく統合されています。PROCは非常によく文書化されていますが、残念ながら表記法で完全に標準化されているわけではありません(PROC OPTMODELとIMLは2つの例です)。複雑なコードを書くことになると、少し不器用であり、並列コードほどエレガントではありません。また、csvファイルをインポートすると、ときどき大きな悲惨さの原因になることがわかっており、最初にRに、次にデータベースにダンプすることを好みます。
SASには共有オブジェクトとdllへのインターフェイスがありますが、ヘッダーファイルまたはそのようなものにアクセスすることはできません。また、幸せなパッケージを介してコードを配布することもできません。
ただし、保守が必要な難解なまたは壊れたパッケージをコードに含める人についてはほとんど懸念がなく、SASのコードの品質は一様に優れている傾向があります(Rコアコードも優れており、また自由に誰でも利用できます)。
前にも述べたように、SASは非常に高価ですが、ニーズに合った缶詰の手順があることがわかったときに行く良いツールです。
R + SAS + mysqlを少しずつperlで結合すると、驚くほどうまく機能します:)
dplyr
ライブラリを介して最近得られた非常に優れたSQLサポートも備えています。文字通り、R / dplyr構文をSQLに変換し、データベースを呼び出します。同じ構文を使用して、dbサーバーで実行する操作とローカルで実行する操作を決定できます:cran.r-project。 org / web / packages / dplyr / vignettes / databases.html
それで、私はRとSASの両方を使用します-確かに学界では-しかし、私は時々SASに向かう傾向があるいくつかの理由があります:
それが好まれる理由が明白な白痴であることを誰も示唆していません。私が最近出会った2つの引用符は次のとおりです。
「Rなどのオープンソースソフトウェアの使用は問題外でした。完全に再現可能な結果を保証することはできませんでした」
そして
「これはオープンソースソフトウェアであるため、これをサポートすることはできません」
これらの人々との2分間は、彼らがいかに間違っているかを示します。
1つの問題が明示的に対処されていないようです:尻カバー。SASを使用して問題が爆発した場合、意思決定者は常に最新のソフトウェアを購入したと言うことができます。彼がRを選択した場合、この議論は難しくなります。はい、これはすでにここで述べた慣性の議論に関連しています。
数十年前、彼らはかつて「IBMを買収したことで解雇された」と言っていました。
SASとRの両方のユーザーとして、私たちがSAS over Rを使用する最大の理由は(そうするとき)、シーケンシャル処理の能力にあります。15年分のデータを処理するために必要なのは、4GBのRAMしか搭載していないマシンだけです。ストックRを使用するより大きなマシンが必要になりますが、SASコードを移行してRevolution Rで実行しようとはしていません。
2015年時点で、35歳未満のアクチュアリーはRの使用を好みます。教科書ではRコードとSASコードの両方を使用しています。古いアクチュアリーはRの使用を学んだことはなく、SASを好み、Rを使用しません。実際にSASでコーディングしているアクチュアリーの割合は減少します。
Googleの学者を検索してSASに関する文献を検索すると、過去数年間、年間550冊の安定した出版物が見つかります。R( "R Foundation for Statistical Computing")を使用して論文を検索すると、2014年には25,100でしたが、2015年7月中旬には16,700です。レートをプロット-それは非常に急速に成長しています!
SASは数年前から大学に多額のライセンス料を要求していませんでした-それはその後逆転しました-しかし、今では多くの大学がSASではなくRを使用した教育に移行しています。
新しい統計手法は、Rパッケージと組み合わせて論文で公開されています。ベースRに長年使用されてきたいくつかのテクニックは、まだSASに登場していません。SAS内部からRを使用できるようになりました。
要約すると、物事は変化し、急速に変化しています。
製薬業界ではSASが使用されます。これは、SASがFDAが使用し、好むものだからです。ただし、いくつかの重大な理由があります。結果は追跡可能であり、出力にはタイムスタンプがあります。FDAの統計担当者は、何が得られるかを確認できます。データベース管理に非常に優れており、信頼性の高いソフトウェアです。もちろん、SASの属性の多くは、RやSASを含む他のソフトウェアパッケージに存在すると主張できますが、高価です。それでも私は、業界で働く応用統計学者になりたいと思う人は誰でも、少なくともSASでプログラムする方法を学ぶのが最善だと思います。SASを知っているが必要な場合は、RまたはSTATAを使用してください。SASの使用を希望する会社で働く場合、ライセンス料を支払います。
(トピックから少し外れています):他のポイントラウンドで見る:Rが学界で持っている利点のいくつかは、業界には適用されません。
たとえば、学界では、ソフトウェアを入手して自宅で仕事をするように生徒に伝えることができれば、明らかに有利です。業界では、通常、データを持ち帰ることは想定されていません...
また、いくつかのことを試してみる(TM)、大量のパッケージをダウンロードする(評判が良くてテスト済みであっても)、最先端の方法を使用することも想定されていません。代わりに、通常、長年使用されてきたメソッドやコードに固執することが期待されており、その動作は長年にわたって知られています。あなたはそれで多くの学問的なメリットを獲得しないでしょう。
そしてもちろん、既に述べたように、Rに切り替えるためにあらゆる種類の規制当局の承認をやり直すリスクは誰にもありません。 。
かなり悲観的ですが、私の答えは、「私たちはSASを使うだけ」のような企業で抜本的な決定を下す人は、理解していないことを信用せず、価値を自動的に考える人でもあるということです何かのお金はあなたがそれに費やす金額に正比例します。これにより、代替手段の調査に時間を費やすよりも、SASへの支払いを好むようになります。
大手製薬会社がSASからRに変換したいのはなぜですか?SASには数百万ドルの費用がかかりますが、製薬会社にとっては何もありません。ただし、すべての安定したレポートシステムをSASからRに変換するには、50〜100倍のコストがかかります。
SASには驚異的なサポートシステムがあります。私が助けを必要とするたびに、彼らは数時間以内にそれを提供することができました。
そして、RにはSASにはないものがあります:1)より良いグラフィックス... OK、それは大きなものですが、グラフィックスがすべてではありません。Rに加えて、いくつかのクールなグラフを作成するための追加ツールを常に使用できます。グラフィックスに関しては、SASはそれほど悪くありません2)モダンでより効率的なプログラミング言語。多くのSASユーザーはプログラマーではなく、クールな言語の使用を気にしません。彼らは単にデータを分析したいだけです。
私はRが大好きですが、大企業がSASに転換するのは正気ではありません。小規模企業にとっては理にかなっていますが
いくつかの主な利点がありますが、順不同です
「レガシー」や「習慣」などの軽jor的な用語の使用を意図的に避けています。多くの企業は30年または40年SASを使用しており、何百万行もの作業コードを持っています。さらに、小さなエラーが重大になる可能性のあるエリアでは、数百万ユーザーの日数がある安定したコードベースのすべての利点があります。これは、Unixが40歳以上であり、いくつかの点で旧式であるにもかかわらず、Unixフレーバーが今でも人気がある理由と同じです。最後に、ビジネスの問題を解決することに慣れている経験豊富なSAS専門家の大規模なコミュニティがあります。
企業には、さまざまなタイプのシステム、および多くの場合、複数のオペレーティング環境に基づいて、さまざまなデータソースがあります。Rはごく最近、メモリ内に保持できる以上のことを処理するための非常に基本的な機能をいくつか取得しました。これを、テラデータのネイティブで最適化されたデータベース内処理をサポートするSASの機能と比較して、ほんの一例を挙げます。実際のほとんどの状況では、分析の最も難しい部分は、データと動作環境を扱うことです。(メインフレームでWindows開発モデルのスコアリングコードを実行する必要がありますか?SASでは問題ありません。Rでは、運が悪いです。)Rは、これらの問題を解決しません。
SASユーザーは、すべてのコードモジュールが有資格者によってテストされたことを合理的に確信できます。コードの出所を学習したり、独自に検証したりするために時間と労力を費やす必要はありません。さらに、あらゆる種類の問題に遭遇した場合、堅牢な支援(ドキュメンテーションのような基本的なものから、洗練された方法の予期しない結果や動作を詳細に調査するような包括的なものまで)は、ユーザーが電話に出て助けを得ることができます。
この言語は、一般的なプログラミングでは現代の言語とは異なるため、一部の人々をオフにします。とはいえ、この言語は高レベルで、強力で、表現力があり、包括的です。要するに、一度それを学ぶと、それは仕事を終わらせる。企業にとって、このソリューションの優雅さはあまりセールスポイントではありません。
顧客サポート。
私はかつてサーバーのインストールを専門とする会社で働いている友人とチャットをしました。そして彼は大企業がオープンソースではなくマイクロソフト製品を選ぶ理由を説明してくれました。マイクロソフトがオープンソースの競合他社より優れているのは、カスタマーサポートです。製品に何か問題が発生した場合、会社はマイクロソフトに電話することができます。大企業も彼らのためにパーソナライズされたサポートを持っています。オープンソースソフトウェアではそうではありません。
SASがRよりも優先されているのとまったく同じ理由だと思います。
フロントエンドはどうですか?SAS Enterprise Guide、Web Report StudioまたはEnterprise MinerのRと同等のものは何ですか?編集:これらのツールを使用すると、プログラミングを行っていないユーザーでも、基礎となるテクノロジーに関する知識がなくても、データウェアハウスを使用できます。これらは主にSASを使用するためのツールではありません。R GUIは、R言語/システムAFAIKの単なるIDEです。DWHから情報と洞察を得たいと思っている非技術ユーザーにヘルプを提供することはできません。
私はかつて、シリコンバレーの大手チップメーカーにSASの支援を提供するコンサルティング会社で働いていました。会社の担当者は、SASがカバーするすべての分野をカバーし、SASが請求しているものの数分の1の費用がかかる別のソフトウェアを使用することにより、まったく同じコンサルティングを提供するという別の会社からのオファーを受けたと語った(1,000,000 ドルに対して 30,000 ドル)。担当者は何をすべきかを検討し、最初にSASを使用したことで解雇されることを恐れ、より安価な代替案を考慮しないことを上司に申し出ないことに決めました。代わりに、彼は私たちのコンサルティング会社が彼らの会社に私たちのコンサルティング料金の大きなブレークを与えると主張しました。当社は同意しました。
アプリケーションのセキュリティについては言及されていないと思います。この質問はStack Overflowで発生しましたが、トピックから外れていたため削除されました。
私は、SASを使用するスウェーデン国立保健福祉委員会と協力しています。私が彼らの統計学者(Rのような)と話をしたとき、彼らはRでダウンロードされたパッケージを信頼していないため、ITの人々はSASを好むと主張します。私の妻もSASで働いており、彼女の機関はしばしば同じ問題を主張しています...
この問題についてのコメントをお待ちしています。クイック検索を実行しましたが、適切な参照が見つかりませんでした...
SASの大きな商業製品であるため、有償販売員による強力で協調的な取り組みがあります。Rの使用を促進する努力がこれらに匹敵するとは思わない。
私は、オープンソースまたはこのようなライセンスされたソフトウェアを見て、それがSASであろうと他のものであろうと。私のIT部門は、私たちのビジネスにサービスを提供しています。同社はITからお金を稼ぐことはなく、ビジネスのITサポートからのみ収入を得ています。事業は、年間売上高がある$ 160億を。IT費用は年間約 2億ドルです。お金が問題だった場合、私はコストを削減するだろうが、私は10%(保存する場合は$私の予算は20万人)、ビジネスの通知は、だろうか?彼らは来年私の予算を削減するだけですか?ITが失敗した場合、ビジネスは収益を失いますが、その程度は失敗の性質によって異なります。事業の一部で収益が得られなくなる可能性があります。SASのような製品が故障した場合、契約に基づいて訴訟を起こすことができます。OSS製品が故障した場合、私はできません。私は$を回復しません160億ですが、私はいくらか取り戻すかもしれませんが、現実的にはSASで多くを失うことはほとんどありません。価格とコストの違いは、ビジネスに対する追加の認識されたリスクを正当化する必要があります。場合によっては、再トレーニングするよりもSASに固執する方が安価です。優先度の高い問題がある場合があるため、企業はSASにとどまります。一部の企業は完全な機能を必要とせず、その場合には代替手段が実行可能です。サポートを必要としないものもありますが、代替案も実行可能です。ビジネス要件を満たしている場合、いずれかのオプションが有効です。ビジネスのサポートを提供する場合は、5〜10年にわたる総所有コスト、ツールの専門家を募集する能力、製品の安定性を確認する必要があります。そのため、新しいリリースごとにすべてを書き直したり、スキルアップのために利用できるトレーニングコースを作成したりする必要はありません。
私が見たことがないいくつかの理由は言及しました:
より良いドキュメント。SASドキュメントは冗長で、Rドキュメントは簡潔です。多くの企業は詳細なドキュメントを好む場合があります。
より良いエラーメッセージ。Rのエラーメッセージは、多くの場合、メッセージを書いている人が読んでいる人よりも賢いことを証明するように設計されているようです。
技術サポート。SASには、SASが提供する最高の技術サポートがあります。Rのヘルプを入手できますが、そのヘルプはさまざまな場所に散らばっており、常に利用できるとは限りません。Rに支援を提供するさまざまなサイトの人々はボランティアです-ボランティアは支援する義務がありません。SAS技術サポートの人々は、彼らがしたことをするためにお金を払われます-そして彼らはそれをうまくやります。彼らはそれをうまくやるだけでなく、すべてのRコミュニティに存在しないことが多い特性を丁寧にやっています(私のお気に入りですか?
WordおよびExcelとの容易な調整。はい、Rでこれを実行できることはわかっていますが、SASの方が簡単です(一方、Rでは方がうまく機能します
レガシーアングルは、次の理由から大きなものになると思います。組織は人を雇い、人Xと呼びます。彼らはコンピューティングの達人/ウィザード/などです。彼らは素晴らしいSASプログラム/ツール/などを構築します。彼らは非常に優れているため、組織内の他の人々は、プログラムがどのように機能するかを理解する必要があるとは感じません。ボタンを押すだけでとても簡単になり、すべてが機能します(マジックブラックボックス)。
X人は組織を去ります。残念なことに、X人が持っている知識は組織を離れています(ドキュメントと知識管理は優先されず、代わりに作業プログラムが優先されました)。それらは人Yに置き換えられます。人YはRに優れていますが、SAS についてはまったく知らないため、SASプログラムが実際にどのように機能するかについてはわかりません。何かを把握するための大きな学習曲線がありますSASの1年間のライセンスよりも大幅に高くなっています。SASがこのトレードオフの分析を行い、これがライセンス料の設定方法に影響を与えることを期待しています(まあ、SASで働いていたなら)。また、SASプロット手順が10年ほど前よりもはるかに優れていることに注目してください(例:proc sgplot vs proc plot)。Rが最初にうまくプロットしたのは偶然ですか?私はそうは思いません!これにより、プロットの効率が低下します。これは、プロットがそれほど変わらないためです。Rは依然として優れていますが、切り替えには十分ではありません。
産業統計には、(通常)プログラミング、統計、または科学のバックグラウンドがなく、統計学者、プログラマー、および科学者を監査する品質保証の人がいます。彼らは、「あなたがやっていることが正しいことをどのように知っていますか?」「それが間違っている場合、どのように誰かを非難することができますか?
GNU / GPLコピーレフトライセンスには、「Rはフリーソフトウェアであり、絶対に保証されない」という内容のテキストが、私が書いたとおりにすべて大文字で書かれています。これは不快です。質の高い人がこのテキストを読むとき、彼らは基本的にRを完全に信用しない。つまり、製品が良ければ、保証を追加する価値はありますか?そのような商業製品は私たちを信じさせました。実際、ソフトウェア業界の大転換を反映したのは、Rの規制当局への提出を受け入れると言ったのは、最終的にはFDAでした。(このステートメントは、質問の元の投稿日より後に来ます。)
コンピューターについて何も知らない人にとっては、この絶対的な保証の欠如の結果として、想定されるセキュリティ、再現性、および重大な科学的エラーのシナリオには限りがありません。間違いは壊滅的なコストを伴う可能性があることに同意します。SASのライセンスについて、SASには監査人にソフトウェアを説明できる専門家がいます。SASが実際にそのような問題を引き起こすという不可能なシナリオでは、罰金や処罰の責任を負うことができます。そのような場合には完全に免罪される)。Rに対してこのケースを提示するアナリスト/プログラマーの負担と費用は、基本的にSASライセンスに相当します。SASでのプログラミングが、品質コンプライアンスの圧倒的な負担から完全に免れているわけではありません!
したがって、基本的には、費用のかかるライセンスソフトウェアを必要とする際に訴訟が重要な役割を果たしていると思います。