BashまたはPythonを使用して別のソフトウェアと対話するRSSパーサー


1

WorkerLinux環境(RaspbianまたはDebianが望ましい)で実行されるプログラムまたはスクリプト(これを呼び出しましょう)を作成しようとしています。RSSフィードからリンクを収集し、処理のために別の2つのプログラムに送信します。

実行Workerすべき特定の手順は次のとおりです。

  1. 改行で区切られたテキストドキュメントから複数のRSSフィードを解析する

    https://example.com/feed.xml?id1 nsfw
    https://example.com/feed.xml?id2
    https://example.com/feed.xml?id3
    [...]
    https://example.com/feed.xml?id9`
  2. 各フィードからリンクを抽出する

  3. <title>要素内の特定のキーワードを持つリンクを削除します。キーワードは、テキストドキュメントの各フィードに対して、それぞれのリンクから次のようなスペースで区切って設定されます。

    https://example.com/feed.xml?id1 nsfw

    設定されていない場合-削除する必要はありません。

  4. 結果のリンクを<published>要素に基づいて日付/時刻で並べ替えます。例:

    <published>2018-07-27T01:02:03+00:00</published>
  5. handlerプログラムへの最新のリンクを送信します(それは既に存在する外部プログラムです)

    handler https://received-from-RSS.com/abc
  6. 送信されたリンクにマークwatchedを付けます(Raspberry Piで実行する必要があり、SDカードの使用量を減らしたいので、メモリ内でのみ行うことが望ましい)

  7. 以下からの応答を収集しhandler、別のリンクが含まれている必要があり、プログラム、およびから得たリンクパスhandlerplayerプログラムを

    player https://received-from-Handler.com/xyz
  8. player再生が終了して閉じるまで待ちます。次に、(まだマークされていないwatched)リンクを時系列順に送信しますhandler

    そして、ステージ5から8を繰り返しています。

  9. 30分ごとにWorkerRSSフィードからのリンクを更新する必要があります。たとえば、ステージ1〜9を繰り返し、watchedリンクをメモリに保持し、リンクをに送信しませんhandler

この機能はBashまたはPythonで実装できると思います。プログラミングの経験はありませんがWorker、稼働させることが必要です。ですから、この特定のプログラムを書くのに役立つ特定の学習教材やコード例を教えていただければ幸いです。私のためにそれを書くことを求めているのではありません。別のステップであなたの助けを感謝します。私はいくつかの指示が必要です

完了したら、ここに結果を投稿します。


1
これを解決するために自分でどのような研究をしましたか?学習教材の推奨のリクエストは、このスタックではトピック外です。参照してください。私が尋ねることができますどのような話題?そして私が尋ねる質問どのような種類のを避けるべきですか?
ジェフ

答えを書く..
xreplace

feedparser-PythonのRSSフィードパーサーライブラリ。datetime-日付でソートするためのPython標準ライブラリ。open-外部プログラムを開きます。スケジュール -定期的なジョブ用。しかし、bashを使用してそれを行うことを好むが、それを使用してRSSを解析する方法がわからない。
xreplace

通常、シェル言語はこのようなプロジェクトに適したツールではありませんが、PowerShellで実行できる可能性はあります。いずれにせよ、一度自分でそれを試み、特定の問題を特定できたら、ここで尋ねるよりも、スタックオーバーフローに関する明確で詳細な質問の方が適切かもしれません。
ジェフ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.