平均気温に対する年間のkWh使用量を表す方法は?


9

ただ面白くするために、家計の月次電力消費量を前年比でグラフ化したいと思います。ただし、kWhの使用に関して、家や行動が改善しているのか、悪化しているのか、または安定しているのかを判断できるように、月間気温への参照も含めたいと思います。

私が扱っているデータ:

+----------+--------+-----------+----------------+----------+-----------+------------+
|  Month   | # Days | kWh Usage | Daily kWh Avg. | Avg. Low | Avg. High | Avg. Temp. |
+----------+--------+-----------+----------------+----------+-----------+------------+
| Mar 2015 |     32 |      1048 |             33 |       40 |        60 |         50 |
| Feb 2015 |     29 |      1156 |             40 |       32 |        54 |         43 |
| Jan 2015 |     33 |      1143 |             35 |       38 |        57 |         47 |
| Dec 2014 |     30 |       887 |             30 |       39 |        61 |         50 |
| Nov 2014 |     29 |       645 |             22 |       45 |        67 |         56 |
| Oct 2014 |     29 |       598 |             21 |       60 |        78 |         69 |
| Sep 2014 |     32 |       893 |             28 |       70 |        85 |         77 |
| Aug 2014 |     30 |       965 |             32 |       72 |        87 |         79 |
| Jul 2014 |     29 |       784 |             27 |       72 |        87 |         79 |
| Jun 2014 |     32 |      1018 |             32 |       69 |        87 |         78 |
| May 2014 |     30 |       702 |             23 |       63 |        82 |         72 |
| Apr 2014 |     33 |       722 |             22 |       50 |        71 |         60 |
| Mar 2014 |     29 |       830 |             29 |       41 |        62 |         52 |
| Feb 2014 |     28 |      1197 |             43 |       32 |        52 |         42 |
| Jan 2014 |     33 |      1100 |             33 |       38 |        59 |         49 |
| Dec 2013 |     30 |       856 |             29 |       40 |        63 |         51 |
| Nov 2013 |     33 |       686 |             21 |       48 |        70 |         59 |
| Oct 2013 |     30 |       527 |             18 |       61 |        77 |         69 |
| Sep 2013 |     30 |       817 |             27 |       69 |        86 |         77 |
| Aug 2013 |     28 |       991 |             35 |       72 |        86 |         79 |
| Jul 2013 |     31 |       993 |             32 |       73 |        86 |         79 |
| Jun 2013 |     30 |       847 |             28 |       66 |        83 |         74 |
| May 2013 |     29 |       605 |             21 |       59 |        76 |         67 |
| Apr 2013 |     34 |       791 |             23 |       47 |        66 |         57 |
+----------+--------+-----------+----------------+----------+-----------+------------+

月ごとの値を簡単に比較する縦棒グラフから始めました。

月次使用量の縦棒グラフ

高/低範囲を示す2番目(右)の縦軸にマップされた素敵な背景領域または折れ線グラフを想像しましたが、複数年のグループ化では問題になることに気付きました。

1年で簡単です。

温度での2014 kWhの使用

私は誰かがすべての年次データを温度比較付きの単一のチャートに組み合わせる方法を推奨できるかどうか知りたいですか?

kWhの使用率を平均温度に効果的に関連付けることができる使用可能な比率はありますか...または見落としている他のいくつかの表示手法...または年に1つのチャートで立ち往生していますか?

回答:


18

私がすることを提案したい重要なことは、開発することである物理的に現実的、実用的なエネルギーコストのモデルを。 これは、生データを視覚化するよりもコストの変化を検出するのに適しています。これをSO提供されいるソリューションと比較することで、曲線をデータに適合させることと意味のある統計分析実行することの違いについて非常に優れたケーススタディが得られます。

(この提案は、このようなモデルを10年前の自分の家庭での使用に適合させ、その期間の変化を追跡するために適用することに基づいています。モデルが適合したら、追跡する目的でスプレッドシートで簡単に計算できることに注意してください。変化するので、スプレッドシートソフトウェアの(機能しない)機能に制限されていると感じるべきではありません。)

これらのデータの場合、このような物理的に妥当なモデルは、単純な代替モデル(月平均気温に対する毎日の使用量の二次最小二乗適合)とは大幅に異なるエネルギーコストと使用パターンの図を生成します。したがって、より単純なモデルは、エネルギー使用パターンを理解、予測、または比較するための信頼できるツールとは見なされません。


分析

tt0αβ

αβ

γ

t0t0t1

γt0

Ls=L/6Avg. LowAvg. HighAvg. Temp

最後に、データを共通の単位時間に標準化する必要があります。 これはすでにDaily kWh Avg.変数に存在していますが、精度が不足しているため、失われた精度を取り戻すために、代わりに合計を日数で割りましょう。

Yt

y(t)=γ+α(tt0)I(t<t0)+β(tt0)I(t>t0)+ε(t)

Iεα,β,γt0t0

x0x1t(x)x

Cost(x0,x1)=x0x1y(t)dt=x0x1(γ+α(t(x)t0)I(t(x)<t0)+β(t(x)t0)I(t(x)>t0)+ε(t(x)))t(x)dx.

ε(t)ε¯t(x)t¯s(t¯)

y¯(t¯)=γ+(βα)s(t¯)2ϕs(t¯t0)+(t¯t0)(β+(αβ)Φs(t0t¯))+ε¯(t¯).

Φss(t¯)ϕ


モデルフィッティング

α,β,γt0t0Rε¯σ

これらのデータの推定は

(α^,β^,γ^,t0^,σ^)=(1.489,1.371,10.2,63.4,1.80).

これの意味は:

  • 1.49

  • 1.37

  • 10.2

  • 63.4

  • 1.80

これらの推定における信頼区間およびその他の不確実性の定量的表現は、最尤法を使用して標準的な方法で取得できます。


可視化

このモデルを説明するために、次の図は、データ、基になるモデル、月平均への近似、および単純な最小二乗近似をプロットしています。

図

t0

特に中間の温度で、フィットが基になる(瞬間的な)モデルからどれだけ離れているかに注意してください!これは月次平均の影響です。(赤と青の線の高さが各水平グレーセグメント全体で「不鮮明」になっていると考えてください。極端な温度ではすべてが線の中央に配置されますが、中温では「V」の両側が平均化され、必要性を反映しますその月のある時間に加熱し、別の時間に冷却するため。)


モデル比較

2.071.97

ただし、2次近似は、何が起こっているのかを学習するのにはまったく役に立ちません。その式、

y¯(t¯)=219.956.241t¯+0.04879(t¯)2,

直接の使用は明らかになりません。公平に言えば、少し分析できます。

  1. t^0=6.241/(2×0.04879)=64.063.4219.956.241(63.4)+0.04879(63.4)2=20.4

  2. y¯(t¯)=6.241+2(0.04879)t¯906.241+2(0.04879)(90)=2.54

    32|6.241+2(0.04879)(32)|=3.12

    606850785010

簡単に言うと、視覚化でほぼ同じように見えますが、エネルギー使用量に関連する基本的な量を推定する際、2次近似は大きく誤ります。 したがって、使用量の変化を評価するための使用は問題があり、推奨されません。


計算

このRコードはすべての計算とプロットを実行しました。同様のデータセットに簡単に適合させることができます。

#
# Read and process the raw data.
#
x <- read.csv("F:/temp/energy.csv")
x$Daily <- x$Usage / x$Length
x <- x[order(x$Temp), ]
#pairs(x)
#
# Fit a quadratic curve.
#
fit.quadratic <- lm(Daily ~ Temp+I(Temp^2), data=x)
# par(mfrow=c(2,2))
# plot(fit.quadratic)
# par(mfrow=c(1,1))
#
# Fit a simple but realistic heating-cooling model with maximum likelihood.
#
response <- function(theta, x, s) {
  alpha <- theta[1]; beta <- theta[2]; gamma <- theta[3]; t.0 <- theta[4]
  x <- x - t.0
  gamma + (beta-alpha)*s^2*dnorm(x, 0, s) +  x*(beta + (alpha-beta)*pnorm(-x, 0, s))
}
log.L <- function(theta, y, x, s) {
  #   theta = (alpha, beta, gamma, t.0, sigma)
  #   x = time
  #   s = estimated SD
  #   y = response
  y.hat <- response(theta, x, s)
  sigma <- theta[5]
  sum((((y - y.hat) / sigma) ^2 + log(2 * pi * sigma^2))/2)
}
theta <- c(alpha=-1, beta=5/4, gamma=20, t.0=65, sigma=2) # Initial guess
x$Spread <- (x$Temp.high - x$Temp.low)/sqrt(6)            # Uniform estimate
fit <- nlm(log.L, theta, y=x$Daily, x=x$Temp, x$Spread)
names(fit$estimate) <- names(theta)
#$
# Set up for plotting.
#
i.pad <- 10
plot(range(x$Temp)+c(-i.pad,i.pad), c(0, max(x$Daily)+20), type="n", 
     xlab="Temp", ylab="Cost, kWh/day",
     main="Data, Model, and Fits")
#
# Plot the data.
#
l <- matrix(mapply(function(l,r,h) {c(l,h,r,h,NA,NA)}, 
                   x$Temp.low, x$Temp.high, x$Daily), 2)
lines(l[1,], l[2,], col="Gray")
points(x$Temp, x$Daily, type="p", pch=3)
#
# Draw the models.
#
x0 <- seq(min(x$Temp)-i.pad, max(x$Temp)+i.pad, length.out=401)
lines(x0, cbind(1, x0, x0^2) %*% coef(fit.quadratic), lwd=3, lty=3)
#curve(response(fit$estimate, x, 0), add=TRUE, lwd=2, lty=1)
t.0 <- fit$estimate["t.0"]
alpha <- fit$estimate["alpha"]
beta <- fit$estimate["beta"]
gamma <- fit$estimate["gamma"]
cool <- "#1020c0"; heat <- "#c02010"
lines(c(t.0, 0), gamma + c(0, -alpha*t.0), lwd=2, lty=1, col=cool)
lines(c(t.0, 100), gamma + c(0, beta*(100-t.0)), lwd=2, lty=1, col=heat)
#
# Display the fit.
#
pred <- response(fit$estimate, x$Temp, x$Spread)
points(x$Temp, pred, pch=16, cex=1, col=ifelse(x$Temp < t.0, cool, heat))
#lines(lowess(x$Temp, pred, f=1/4))
#
# Estimate the residual standard deviations.
#
residuals <- x$Daily - pred
sqrt(sum(residuals^2) / (length(residuals) - 4))
sqrt(sum(resid(fit.quadratic)^2) / (length(residuals) - 3))

4
これは、私が読んだスタックオーバーフローの質問に対する唯一の最良の応答かもしれません。解決策の背後にある論理と推論を説明するのにかかった時間に非常に感謝しています。
Shawn

1
物理学はこれよりも毛深いです。凝縮器と蒸発器は、加熱と冷却で役割を切り替えます。つまり、1つの連続システムではなく、2つの異なるシステムのように動作します。暖房度の日、冷房度の日、および除湿度の日は、3つの個別のコスト要因であり、地理的な場所(k、wi、ca、az、mo、flなど)に応じて不連続に動作する可能性があります(暖房シーズンの終わりです)冷却の開始と同じではありません)。データのまともな統計では、4シーズンではなく5シーズンがあると言われています。5月は、少なくとも過去5年間で独自のシーズンです。
EngrStudent 2016年

@ EngrStudentすべての良い点と大いに感謝します。ここで紹介するアプローチは、簡略化されていますが、これらの微妙な影響を取り除くための基礎を築くために必要なものを示していると私は主張します。モデルの大きな条件を処理すると(温度がコストの主要な原因である必要があることを誰も否定できないと思います)、物理的に意味のある方法でそれを行った場合他の条件を特定できる可能性がありますそして、おそらくそれらの効果を正確に推定することさえします。大きな用語を正しく処理しない場合、他の用語を特徴付けることはできません。
whuber

私はこの良い基盤/分析が大好きです。批判ではなく拍手としてこれを聞いてください。加熱プロセスは冷却とは異なるため、両側の非区分的2次関数はそれと矛盾する場合があります。蒸発器コイルは、冷房中は屋内にあり、暖房中は屋外にあります。ヒートポンプでは、霜取りサイクルと「熱のバックアップ」も行われます。また、コンプレッサーは、より極端な屋外温度と戦うために熱心に働く必要があるため、より多くの熱を移動するだけでなく、より高い丘に移動します。線形ではありません。湿度は大きく、エネルギー収支の2/3になることがあります。空気の浸透。
EngrStudent 2018

@EngrStudentありがとうございます。これらはすべて興味深い点です。湿度が予算のこのような大きな割合を占める可能性があることを私は知りませんでした。これは、優れた理論(または一部のサークルでは「概念モデル」)を統計分析に結び付けることの潜在的な価値を例示する種類の観察です。
whuber

0

StackOverflowで回答を受け取りました。誰かが追加の考えを持っている場合、私はまだ代替ソリューションに非常に興味があります。

/programming/29777890/data-visualization-how-to-represent-kwh-usage-by-year-against-average-temperatu


1
SOのソリューションは信じられないです。ニュートンの冷却法則は、出発点として有用な合理的な1次近似であり、エネルギー使用量と温度のプロットは2つの線(おそらく異なる勾配)の和集合であるべきであることを示唆しています。平均は、毎日(および毎時)の温度変動を隠し、これらの線の交点(加熱も冷却も不要)の領域をぼかします。そこでは二次フィットが妥当かもしれませんが、漸近的にフィットは線形である必要があります
whuber

平均ぼかし精度はわかっていますが、そのデータは持っています。統計についての理解が不十分なため、「2行の和集合である必要があります...」「漸近的にフィットは線形である必要がある」というフレーズを理解できません。初心者のPOVから、SOポストは直感的に思えます。それは、エネルギー消費が温度スケールの両端で増加する一方で、加熱も冷却も必要とされないミッドレンジで最低になるという私の予想に一致するからです。二次近似は対称ではないでしょうか?私たちは冷房より暖房に多くの電力を使用するので、電力使用は対称的だとは思わない。訂正やアドバイスをいただければ幸いです。
Shawn

二次近似は対称ではありますが、極端な場合は非物理的です。これは、物理的に妥当な場合よりも、最低温度での加熱にはより多く、最高温度での冷却にはより多くの費用がかかるということです。さらに、プロットの対称性は、1度あたりの家の冷房のコストが1度あたりの家の暖房のコストと同じである場合にのみ予想されます。これは、冷暖房システムが同等に効率的であることを前提としています。その場合もそうでない場合もありますが、モデルにその対称性を課すべきではありません。
whuber

程度ごとに熱よりも冷却する方がコストがかかるので、私はそれが異なることに同意します。ただし、最初のコメントを理解したので、SOポストからの2次近似は合理的ではあるものの、正確ではなく、線形近似はニュートンの冷却の法則により技術的に正しい答えですか?私が理解できていないのは、SOソリューションの妥当性ではありません。
Shawn

1
コメント欄に最後の質問に対する私の回答をうまく収めることができなかったので、代わりに回答として投稿しました。ただし、1度あたりの冷却コストが1度あたりの暖房コストよりも高いとはどう思われますか。あなたのデータは反対が真であることを示しているようです(ただし、コストはかなり近いですが、予想どおりです)。また、線形モデルは線形フィットを意味しないことに注意してください。データがこの基本的なモデルから体系的に逸脱する原因はたくさんあります。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.