シューハート管理図
プロアナリスト +AI
Windows、Mac、Linux用

ロシアのソフトウェアの登録 (エントリ番号 18857、2023 年 9 月 5 日付け)

ソフトウェアを購入する

無制限の数の因子に対する分布ヒストグラムと熱相関行列を備えた相関プロット (散布図) のペア

多変量統計分析 MSA (多変量統計分析)。

[多変量統計解析]ボタン

分布ヒストグラムと相関ヒート マップを備えた散布図機能は、データで表される多くの要素 (測定値とカウント) 間の統計関数関係を視覚的に表現する効果的な方法を提供します。各グラフには傾向線の方程式、ピアソン相関係数 [R] および決定係数 [R²] が表示されます。

値の分布のヒストグラムと相関関係のヒート チャートを含む散布図を作成するための構造化スプレッドシート ファイルの例をダウンロードできます。 XLSX

テーブル ファイルからの構造化データはインポートに使用できます: Excel ワークブック (*.xlsx)、Excel バイナリ ワークブック (*.xlsb)、OpenDocument スプレッドシート (*.ods)。

高い相関係数は、分析された要因間の因果関係を証明するものではなく、それらの統計的機能的関係を示すことに注意することが重要です。たとえば、両方の要因が他の要因または他の要因のグループに依存する可能性があります。

メイン プログラム ウィンドウのメニューが開き、多次元データ分析コントロール パネルに移動します。

図 1. メイン プログラム ウィンドウのメニューが開き、多次元データ分析コントロール パネルに移動します。

定性的特性の多因子相関分析-1.

図 2. ボタンの上にマウスを置くと、ドロップダウン ツールチップが表示され、個々の値の分布のヒストグラムを含むペア相関グラフ (散布図) のコントロール パネルに移動します。

質的特性の多変量相関分析-2.

図 3. ヒストグラムを含む散布図コントロール パネル。散布図グラフ上のユーザーが選択した点上でマウスの左ボタンをクリックすると、データ ポイント (行) の番号を示すキャプションが表示されます。ヒート マップでユーザーが選択した色付き領域でマウスの左ボタンをクリックすると、Y、X 軸に沿ったソース データ列の名前と相関係数を示すキャプションが表示されます。署名を非表示にするには、署名領域を右クリックします。

監視される測定可能な要素が多数あるため、経験豊富な技術者であっても、監視されるプロセス特性間の考えられる関係を理解し​​続けることは困難です。当社のソフトウェアを使用すると、ワンクリックで無制限の数の因子を分析し、異常な外れ値 (グラフ上の母集団全体の外側の点) やペアの相関の予想サイズと方向 (負、ゼロ、正) の不一致に注意を払うことができます。分析値の。

定性的特性の多変量相関分析粘度およびpH

図 4. ヒストグラムを含む散布図コントロール パネル。ヒート チャート コントロールの [実行] ボタンの上にマウスを置くと、ツールチップ ドロップダウンが開きます。

多変量相関分析 エイムズ住宅データセット

図 5. ヒート チャート コントロール パネル。ヒート チャートの相関係数のラベルは無効になります。ヒート チャート コントロール パネルでは、35 個のソース データ列すべての範囲が選択されています。ヒート マップ上でユーザーが選択した相関領域のキャプションが表示されます。データ ソース: エイムズ住宅データセット。

「4.552e+04」という表現は、数値 45,520 を意味します。この数値は科学的表記法で表され、「e+04」は 10 の 4 乗、つまり数値に 10 を 4 回掛けることを意味します。

多変量相関分析 エイムズ住宅データセット

図 6. ヒート チャート コントロール パネル。ヒート チャート コントロール領域では、相関値ラベルが有効になり、ソース データの列 25 から列 35 (両端を含む) までの範囲が選択されます。データ ソース: エイムズ住宅データセット。

定義

相関係数と決定係数は相互に関連しており、両方とも 2 つの変数間の関係の程度を測定するために使用されます。

相関係数 (R または r で示される) は、2 つの変数 (x) と (y) の間の線形関係の程度を測定します。 -1 から 1 までの値を取ります。-1 は完全な負の線形関係を意味し、1 は正の線形関係を意味し、0 は線形関係がないことを意味します。相関係数は、データ ポイントが傾向線または回帰線にどの程度近いかを示します。したがって、データ ポイントが傾向線に近づくほど、相関係数が高くなり、変数 (x) と (y) の間の関係が強くなります。

決定係数 (R² または r² として示される) は、相関係数の 2 乗です。これは、従属変数 (y) の分散のどの程度が独立変数 (x) によって説明できるかを示します。決定係数の範囲は 0 から 1 で、0 は独立変数が従属変数の変動性を説明しないことを意味し、1 は独立変数が従属変数の変動性を完全に説明することを意味します。

したがって、相関係数は変数間の関係の程度を示し、決定係数は独立変数が従属変数の変動性をどの程度説明しているかを示します。

排出量の定義

多くの場合、単純なグラフ手法を使用すると、ペア内の 2 つの因子のどちらが観察された外れ値の原因であるかを理解することができます。これを行うには、各因子のヒストグラムとそれ自体の相関グラフを確認するだけです。図 6 を参照してください。

多変量相関分析: 因子 1 および因子 3 とそれ自体の相関関係のグラフ

図 7. 相関ヒート チャート ダッシュボード: すべての要素と要素 1 とそれ自体の相関関係のグラフ。 Factor-1 の 2 つの値の記録には問題があります。

操作上の意味 このような「外れ値の犯人」の理解は、因子 1 の初期データに従って構築された、個々の値に対するシューハートのコントロール XmR チャートによってのみ確認または反駁できます。以下の図 5 を参照してください。

Factor-1 の初期データ (異常値を削除する前) に従って構築された、個々の値の XmR チャートを制御します。

図 8. 因子 1 の初期データ (異常値を除去する前) に従って構築された、個々の値のコントロール XmR チャート。

Factor-2 の初期データに従って構築された、個々の値の制御 XmR マップ

図 9. Factor-2 の初期データに従って構築された、個々の値の Control XmR チャート。 mR-map グラフ上の 81 から 89 までの一連の赤い点は、これらの点に現れた特別な理由を理解するための理由です。重要なのは、図 4 の多変量解析にはこの機能がないことです。

Factor-3 の初期データに従って構築された、個別値の XmR マップを制御します。

図 10. Factor-3 の初期データに従って構築された、個々の値の Control XmR チャート。

重要

場合によっては、外れ値ポイントを 1 つだけ削除すると、相関の方向 (傾向線の方向) が正の相関から負の相関に変わることがあります。トレンド ラインおよび自動的に計算されるすべての導関数 (トレンド関数の方程式、決定係数 R2 (近似の信頼性の値)、相関関係 R など) がこのような動作をする可能性があることに注意する必要があります。この指摘は、元のデータから構築された線形回帰式や他のタイプの回帰式にも当てはまります。最初のステップは、シューハート管理図にグラフィカルに表示されたデータを確認することです。オペレーターの初期データ入力プロセスに注意を払い、入力された値の自動検証を使用してプロセスを改善します。

例。長さと直径だけがわずかに異なる 1 種類の製品を製造しているある大規模製造企業では、一対の製品真円度指標の多変量相関分析の結果、これらの指標の相関方向が逆であることが実証され、元の製品には外れ値の証拠はありませんでした。データ。ラインオペレーターが同じ工程を製品のサイズに応じて制御する方法が異なることを生産管理に指摘することができ、オペレーターが実際に何をしているのかを調査することにつながりました。

多くの場合、放出は、コントローラによってデバイスから読み取られた値を記録する際のエラーなどの些細な理由によって引き起こされます(これは特別な理由です)。シューハート管理図は、たとえば、整数部と小数部を区切る符号が 1 桁シフトされるなど、プロセスの管理上限および下限によって制限されるゾーン外の誤った入力に簡単に対処します。たとえば、0.232 の代わりに、0.0232 または 2.32 が書き込まれます。

ただし、1 桁の記録時にエラーが発生した場合、コントローラが値の記録を誤って、同時にプロセスの上限と下限の管理限界によって制限された領域内にとどまってしまう場合があります。たとえば、(0.232) の代わりに (0.282) と書かれます。この場合、多変量統計関数は、書き込みエラーのあるデータ行を識別する可能性が高くなります。ただし、シューハート管理図の堅牢性 (汎用性) は、そのような誤差がプロセス管理限界の計算に重大な影響を与えないという事実によるものであり、これがシューハート管理図の最も重要な特性であることを理解する必要があります。

数値計算ツールは、ソフトウェアの回帰モデル (連続変数の予測) の機械学習機能、または Microsoft Excel に含まれるデータ分析パッケージを使用して、データの線形回帰モデルを計算できます。次に、シューハート管理図 (XmR または XbarR) を使用して、残差 (実際の値とモデルの予測値の差) を分析できます。管理図に変動の特殊原因の兆候のあるサブグループ (赤い点) が表示されている場合、これはデータ モデルと現在のプロセスの不一致を示している可能性もあり、これらの原因に対処して排除する必要があります。

たとえば、回帰モデルの [残差] の値から構築された、個別の値と移動範囲のコントロール XmR チャートは、次のように機能します。 運用上の定義 、散布図で観察された外れ値 (外れ値または外れ値ではない) についての主観的な判断ではありません。

さらに、このような分析では、線形回帰関数によって予測された値に対する実際の値の偏りに関する情報が保持されるため、データの解釈が大幅に容易になり、ホテリング T2 チャートを使用したデータ分析との重要な違いとなります。

多要素SPCへの情熱について

従来のシューハート管理図とは対照的に、多要素プロセスをより効果的に制御するための多変量統計的プロセス制御の目的について、工場レベルのプロセスではなく数値を扱うことを好む多くの専門家の発言は、意味がありません。あたかもシューハート、デミング、ウィーラーが単一要素プロセスの管理図を作成したかのように、そのようなプロセスはまったく存在しません。さらに、生産プロセスは、シューハート管理図を使用して管理を開始していない場合、統計的に制御できない (予測できない) 状態にある可能性が高くなります。このようなプロセスのシューハート管理図には、特殊な原因を排除し、プロセスを統計的に制御された状態にするために処理する必要がある信号がすでに含まれています。

多変量解析は経営陣にとっては最先端の技術のように思えるかもしれませんが、多変量統計制御を使用して学んだことを現場の労働者に説明しても、彼らは混乱するだけであり、製造現場のプロセスを改善するという「非常に難しい」仕事であることが確認され、さらに会社の意欲を削ぐことになります。フロアレベルの従業員。