こんにちは。
SAS Institute Japan株式会社 JMPジャパン事業部 シニアテスターの小野と申します。
ご質問の趣旨を間違えているかもしれませんが、<傾向スコアマッチングにおいて、国籍・性別・年齢をロジスティックモデルの説明変数に含めて傾向スコアを求めた場合、傾向スコアマッチングでマッチングされるペアは「似通った国籍」をもつ人々なのか?>というご質問だとして、以下に私の個人的な意見を記載いたします。
「統計家に対する集合名詞は「喧嘩」だ」(The collective noun for statisticians is "a quarrel.")という言葉もあるように、統計学にはいろいろな考え方があると思いますので、以下はあくまで一つの考え方です。
傾向スコアマッチングでマッチングされるのは、第一義的には<傾向スコアが似ているペア>です。よって、交絡因子(共変量)が似ているペアが必ずしもマッチングされるわけではありません。傾向スコアマッチングのこの特徴はたびたび強く批判されています。傾向スコアマッチングに対する有名な批判論文として、以下のものがあります。
Gary King and Richard Nielsen. 2019. “Why Propensity Scores Should Not Be Used for Matching.” Political Analysis, 27, 4, Pp. 435-454. Publisher's Version Copy at https://tinyurl.com/y5b5yjxo
この批判の要点を理解するためには、<もし、完全ランダム化比較実験で傾向スコアマッチングを行うとどうなるのか?>を想像してみるのがいいと思います。完全ランダム化比較実験では、傾向スコアはすべて0.5なので、どの患者とマッチさせてもOKとなります。よって、日本籍男性60歳がメキシコ籍女性30歳とがマッチングされることもあります(この両者の傾向スコアはともに0.5であるため)。ここまで極端でないとしても、もしも、日本籍男性60歳とメキシコ籍女性30歳が同じような傾向スコアの値となっている場合、これらがマッチングされることが傾向スコアマッチングにはあります。
Rosenbaum, P.R.(高田悠矢・高橋耕史訳)『因果推論とは何か』日本語訳 pp.49-53の仮想例も、傾向スコアマッチングが何をしているかの直観的理解に役立つと思います。
交絡因子(共変量)が同じであれば傾向スコアは同じになります。しかし、逆は成り立たず、傾向スコアが同じであっても交絡因子(共変量)は同じにはなりません。(難しい専門用語で言うと、傾向スコア(およびそれを単調変換したもの)は、もっとも粗いバランシングスコアとなっているという特徴があります。)
国籍・性別・年齢を説明変数としたロジスティック回帰モデルで傾向スコアを求めて傾向スコアマッチングしても、必ずしも"似たような国"(たとえば、<食生活が似ている国>、<医療慣習が似ている国>、<保険制度が似ている国>、<併用薬が似ている国>、<年齢構成が似ている国>などなど)がマッチングされるわけではありません。それどころか、日本籍男性60歳がメキシコ籍女性30歳とマッチングされる可能性もあります。
上記の返信がご質問の意図と違う場合には、お手数ですがお知らせください。