Excelmaticコマンド記述ガイド
目的
Excelmaticが求める結果を正確に、迅速に、最小限の修正で生成するための効果的なコマンドの作成方法を教えます。
なぜこれが重要なのか
Excelmaticは自然言語の指示に依存しています。曖昧または不十分に指定されたコマンドは、AIに推測を強いることになり、不完全、不正確、または過度に一般的な出力が生成される可能性が高くなります。明確な意図 = より良いスプレッドシート、より速い処理。
1. コマンド記述の基本
4つの柱に焦点を当てます:
- アクション:何をすべきか?(重複を削除、計算、グループ化、予測、可視化、抽出、フォーマット)
- スコープ:どの列/行/シート/ファイル?正確な列名を一重引用符で使用。
- 条件:フィルター、閾値、日付範囲、ビジネスルール。
- 出力形式:新しいシート、上書き、サマリーのみ、グラフ、クリーンなファイル、列追加など。
良い例と悪い例(基本例)
目標 | 悪い(曖昧) | 良い(具体的) | なぜ良いのか |
---|---|---|---|
重複削除 | ファイルを修正して | 'Customer ID'に基づいて重複を削除;最初の出現を保持;新しいシート'Cleaned'として出力。 | キー列 + ルール + 出力先を指定 |
売上要約 | データを分析して | 'Region'と'Quarter'で'Sales'を合計;合計行を含め、売上順で降順。 | 明確な集約 + グループ化 + ソート |
データソート | きれいにして | 'Date'昇順、次に'Revenue'降順でソート;ヘッダーを保持。 | 明示的な多レベルソート |
メトリック追加 | ファイルを改善して | 列'Profit Margin' = (Revenue - Cost)/Revenue * 100を追加;パーセンテージで小数点以下2桁でフォーマット。 | 明示的な数式 + フォーマット |
フィルター | クリーンにして | 'Revenue' > 1000 AND 'Region' = 'West'の行をフィルター;フィルターされた行のみ出力。 | 正確な条件 |
グラフ | グラフを作成して | 棒グラフを作成:x='Product'、y='Sales'、降順ソート、タイトル'Top Product Sales'、新しいシート'Charts'に配置。 | 軸 + ソート + メタデータを定義 |
シンプルなパターン
アクション + 対象列 + 条件 + 変換 + 出力形式
例:過去90日間('Order Date' >= 2025-05-28)の'Channel'別の平均'Order Value'を計算;サマリーテーブル + 棒グラフを出力。
2. 精度の向上
これらの表現技法を使用します:
- 列の特定性:'Customer ID'(customer idやIDではなく)(可能であれば大文字小文字を一致させる)。
- 集約:合計、平均、一意カウント、中央値、最小、最大、標準偏差。
- 計算:"列'Net' = Revenue - Cost - Taxを追加"。
- 時間枠:過去30日間、2024-01-01から2024-12-31の間、今月。
- ソート:'Date'昇順、次に'Sales'降順でソート。
- フォーマット:'Date'をYYYY-MMでフォーマット、'Profit Margin'をパーセント小数点以下1桁でフォーマット。
- 出力配置:現在のシートを上書き/新しいシート'Summary'を作成/両方を保持。
- 保持:元のシートを未変更で保持。
- 行制限:'Sales'で上位20を表示。
3. 高度なコマンド技法
A. 条件ロジック
例:
- 'Revenue' > 1000 AND 'Region' IN ("West","North")の行をフィルター。
- 'Category' = 'Accessories'の場合、'Price'のnullを中央値で置換。
- 外れ値をフラグ:'ZScore' > 3の場合1、そうでなければ0の'Is Outlier'列を追加。
B. 一度に複数のタスクを組み合わせる
順序が明確な場合は関連する操作をチェーンします。 例:'Order ID'の重複を削除して'Orders'をクリーン、欠損している'Cost'を中央値で埋め、'Margin'=(Revenue-Cost)/Revenue*100を追加、次に'Region'別の平均'Margin'の棒グラフを作成。
C. 大規模データセット戦略
- 開始:構造サマリー(列、型、行数)を提供。
- 次に:仮定を確認するために10行のサンプル(ランダムまたは先頭)を生成。
- 検証後:完全な変換を実行。
- 重いタスクには段階的なコマンドを使用:(1) クリーン、(2) メトリック追加、(3) 可視化。
D. 出力管理
指定:"新しいシート'Cleaned'を作成"、"既存の'Sheet1'を置換"、"新しいシート'Charts'にグラフを追加"、"サマリーのみを返す(行レベルエクスポートなし)"。
E. 説明を求める
変換を監査するために"各ステップを説明"または"数式の根拠を提供"を追加。
F. 複雑な数式
例:過去12か月間の'Customer ID'別の列'LTV' = (AverageOrderValue * PurchaseFrequency * GrossMargin %)を追加;降順ソートした顧客レベルテーブルを出力。
G. 反復的改良
- 最初:高レベルサマリー。
- 次:スコープを絞る(例:Region='West'のみ)。
- その後:メトリック/ビジュアルを追加。
H. ファイルの結合
"アップロードされた月次ファイルをマージ;ファイル名から'Month'(YYYY-MM)を追加;すべてを1つのテーブルに連結;一貫した列順序を確保;合計行を追加。"
I. データ品質チェック
"10%以上の欠損値がある列をリスト;填充方法を提案;まだ変更しない。"
4. 一般的なコマンドテンプレート
コピー、適応、実行。括弧内の項目を置き換えてください。
クリーニングと準備
- '[Primary Key]'の重複を削除し、最初を保持。
- '[Date Column]'の日付形式をYYYY-MM-DDに標準化。
- '[Column]'の欠損値を中央値で埋める。
- '[Full Name]'を'First Name'と'Last Name'に分割。
- すべてのテキスト列の空白を削除。
- z-score > 3を使用して'[Metric]'の外れ値を検出し、影響を受ける行をリスト。
変換
- 列'[New Metric]' = ([Numerator] - [Denominator]) / [Numerator] * 100をパーセント形式で追加。
- ピボット:'[Row Dim]'と'[Column Dim]'で'[Value]'を合計。
- 列'[Jan]'..'[Dec]'を'Month','Value'にアンピボット。
分析
- 記述統計:['Col1','Col2']の平均、中央値、最小、最大、標準偏差。
- '[Var A]'と'[Var B]'の相関と解釈。
- トレンド:'[Date]'での'[Metric]'をプロット、期間対期間成長を計算。
- 線形回帰を使用して'[Metric]'の次の6期間を予測;信頼区間を含む。
可視化
- 棒グラフ:x='[Category]'、y='[Value]'降順ソート。
- 線グラフ:x='[Date]'、y='[Metric]'移動平均ウィンドウ7。
- 円グラフ:'[Value]'による'[Category]'のシェア。
- 散布図:'[X]' vs '[Y]'回帰線 + 相関を追加。
ビジネスインテリジェンス
- KPIサマリー:Revenue、Cost、Profit = Revenue - Cost、Margin %を計算。
- 'Signup Month'による0-6か月のリテンションを示すコホート分析。
- What-if:'[Price]'を10%増加させ'Profit'を再計算;差分をサマリー。
複数ファイル操作
- アップロードされたすべてのファイルをマージ;'Source File'列を追加;ヘッダー名で列を整列。
- ファイルを追加後、'[ID]'の重複を削除。
フォーマットと出力
- '[Currency Column]'をUSD通貨小数点以下2桁でフォーマット。
- '[Date]'昇順、次に'[Revenue]'降順でソート。
- 集約テーブルのみで新しいシート'Summary'を作成。
- 元のシートを保持;変換されたデータを'Cleaned'に配置。
監査とQA
- レビューのためにクリーニング後の10ランダム行を表示。
- 5%以上の欠損値がある列をリスト;填充戦略を提案。
5. 良い例と悪い例のギャラリー(シナリオ別)
シナリオ | 悪い | 改良 | 最良 |
---|---|---|---|
クリーニング | これを修正 | 重複を削除 | 'Order ID'の重複を削除、null'Cost'を中央値で埋め、'Date'をYYYY-MM-DDに標準化、新しいシート'Cleaned'に出力。 |
分析 | 売上を分析 | 売上を合計 | 'Region'と'Quarter'で'Sales'を合計;前四半期比成長を含み'Sales'降順でソート。 |
可視化 | グラフを作成 | 商品の棒グラフ | 棒グラフ:x='Product'、y='Sales'、上位15のみ、降順ソート、タイトル'Top 15 Products'、新しいシート'Charts'。 |
BI | 予測 | 売上を予測 | 線形回帰を使用して'Revenue'の次の6か月を予測;テーブル + 線グラフ + 95%信頼区間を含む。 |
6. トラブルシューティングと改良
症状 -> アクション:
- 出力が一般的すぎる:具体的な列、メトリック、グループ化レベルを追加。
- 間違った列が選択された:正確な引用符付き列名を使用;オプションで列をリスト:"まず全列名をリスト"。
- フィルター後に行が不足:フィルターロジックを明示的に再記述し、包含/排他的(例:Revenue >= 1000)を言及。
- 間違った日付解析:対象形式とタイムゾーン(関連する場合)を指定。
- 予期しない集約:希望する関数(合計 vs 平均 vs カウント一意)を記述。
- 大きなファイルで遅い:最初にスキーマサマリーを求める;次に変換をステップで実行。
- 数式の誤計算:明示的な数式の括弧と希望するフォーマットを提供。
- 期待通りのグラフでない:グラフタイプ、軸、ソート、制限(上位N)、タイトル、凡例を含むかどうかを定義。
- 元に戻す必要がある:"元のデータを使用(以前の変更を無視)"で再実行。
改良ループテンプレート
- 初期の広範囲:"列リストと行数を提供;まだ変更なし。"
- フォーカス:"'Customer ID'の重複を削除;削除数を表示。"
- 拡張:"'Profit Margin'列を追加。"
- 可視化:"'Region'別の平均'Profit Margin'の棒グラフを作成。"
- 仕上げ:"'Profit Margin'をパーセント小数点以下1桁でフォーマット;降順ソート。"
説明を求める
ロジックを検証するために"ステップを説明"または"使用された数式を表示"を追加。
7. クイックリファレンス チートシート
目標 | テンプレート |
---|---|
重複削除 | '[Key]'に基づいて重複を削除し最初の出現を保持;新しいシート'[Name]'に出力。 |
フィルター | '[Column]' > / < / = / IN (...)および...の行をフィルター;フィルターされたシートを出力。 |
集約 | '[Group1]'と'[Group2]'で'[Value]'を合計し、合計降順でソート。 |
メトリック追加 | 列'[New]' = ([A]-[B])/[A]*100をパーセント小数点以下1桁でフォーマットして追加。 |
日付クリーン | '[Date]'をYYYY-MM-DDに標準化。 |
ピボット | ピボット:行'[RowDim]'列'[ColDim]'で'[Value]'を合計。 |
予測 | 線形回帰 + 信頼区間を使用して'[Metric]'の次のN期間を予測。 |
グラフ | [bar/line/pie/scatter]グラフを作成 x='[X]' y='[Y]' 降順ソート 上位N=10 新しいシート'Charts'。 |
外れ値 | z-score > 3を使用して'[Metric]'の外れ値を検出し行のみリスト。 |
ファイルマージ | アップロードされたすべてのファイルをマージ;ファイル名から'[Source]'列を追加;列を整列。 |
8. 最終的なヒント
- 最初は明示的に;パターンを学習した後に簡潔に。
- 曖昧さを避けるために列名を引用符で囲む。
- 論理的に連続するステップのみを組み合わせる。
- 重要な財務またはコンプライアンス関連データを監査する際は説明を要求。
- 反復:広範囲なサマリー -> 対象変換 -> 拡充 -> 可視化 -> フォーマット。
インスピレーションが必要?ドメインの使用事例については入門ガイドを再確認してください。練習の準備—次のデータセットで3ステップチェーンを試してください。
フィードバックまたは頑固なコマンドがありますか?[email protected]までお問い合わせください。あなたの改良がAIの改善に役立ちます。
9. 最初の練習コマンド
最近の売上エクスポートをアップロードし、次を実行してください:
'Order ID'の重複を削除;欠損している'Unit Cost'を中央値で埋める;'Gross Margin %'=(Revenue-Cost)/Revenue*100をパーセント小数点以下1桁でフォーマットして追加;'Region'別の平均'Gross Margin %'の棒グラフを降順ソートで作成;グラフを新しいシート'Charts'に配置。
そこから改良してください—これでパワーユーザーのように書いています。